Vertex AI – Preise
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Auf dieser Seite werden die Preise für generative KI in Vertex AI beschrieben. Für alle anderen Vertex AI-Preise, einschließlich ML-Plattform und MLOps-Dienste finden Sie auf der Preisseite für Vertex AI.
Google-Modelle
Gemini
Mit den multimodalen Modellen in Vertex AI können Sie entweder Text oder Medien (Bilder, Video). Text wird nach 1.000 Zeichen des Eingabe (Prompt) und alle 1.000 Zeichen der Ausgabe (Antwort). Zeichen sind die durch UTF-8-Codepunkte gezählt werden und Leerraum aus der Zählung ausgeschlossen wird. Das sind etwa 4 Zeichen pro Token. Vorhersageanfragen, die dazu führen zu gefilterten Antworten wird nur die Eingabe in Rechnung gestellt. Am Ende jeder Abrechnung Bruchteile von einem Cent (0, 01 $) auf einen Cent aufgerundet werden. Medieneingabe wird pro Bild oder Sekunde (Video) in Rechnung gestellt.
Modell | Funktion | Typ | Preis ( =< 128.000 Kontextfenster) |
Preis (> 128.000 Kontextfenster) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00002 $ / Bild 0,00002 $ / Sekunde 0,00001875 $ / 1.000 Zeichen 0,000002 $ / Sekunde |
0,00004 $ / Bild 0,00004 $ / Sekunde 0,0000375 $ / 1.000 Zeichen 0,000004 $ / Sekunde |
Textausgabe | 0,000075 $ / 1.000 Zeichen | 0,00015 $ / 1.000 Zeichen | ||
Gemini 1.5 Pro | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,001315 $ / Bild 0,001315 $ / Sekunde 0,00125 $ / 1.000 Zeichen 0,000125 $ / Sekunde |
0,00263 $ / Bild 0,00263 $ / Sekunde 0,0025 $ / 1.000 Zeichen 0,00025 $ / Sekunde |
Textausgabe | 0,00375 $ / 1.000 Zeichen | 0,0075 $ / 1.000 Zeichen | ||
Gemini 1.0 Pro | Multimodal | Bildeingabe Videoeingabe Texteingabe |
0,0025 $ / Bild 0,002 $ / Sekunde 0,000125 $ / 1.000 Zeichen |
|
Textausgabe | 0,000375 $ / 1.000 Zeichen | |||
Fundierung mit der Google Suche | Text | Fundierungsanfragen | 35 $ pro 1.000 Anfragen (für bis zu 1 Million Anfragen pro Tag). Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr benötigen. als 1 Million Anfragen pro Tag. |
* Die Preise sind in US-Dollar ($) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, werden die Preise in Ihrer Währung
Cloud Platform-SKUs
angewendet werden.
* Wenn ein Abfragekontext länger als 128.000 ist, werden alle Tokens zu langen Kontextpreisen in Rechnung gestellt.
* Gemini-Modelle sind im Batchmodus mit 50% Rabatt verfügbar.
* Gemini 1.0 Pro unterstützt nur ein Kontextfenster von bis zu 32.000.
* PDFs werden als Bild in Rechnung gestellt, wobei eine PDF-Seite einem Bild entspricht.
Imagen
Mit Imagen in Vertex AI können Sie neue Bilder generieren und Bilder basierend auf von Ihnen bereitgestellten Text-Prompts bearbeiten oder nur Teile von Bildern bearbeiten, indem Sie einen von Ihnen definierten Maskenbereich und eine Reihe weiterer Funktionen verwenden.
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Bild 3 | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,04 $ pro Bild |
Imagen 3 Schnell | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,02 $ pro Bild |
Image 2, Imagen | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,020 $ pro Bild |
Bildbearbeitung | Bild mit maskenfreiem Ansatz oder Maskenansatz bearbeiten | Bild-/Text-Prompt | Bild | 0,020 $ pro Bild | |
Auflösung wird erhöht | Auflösung eines generierten Bildes auf 2.000 und 4.000 erhöhen | Bild | Bild | 0,003 $ pro Bild | |
Optimierung | Aktivieren Sie einen "Betreff", der vom Nutzer für die Verwendung von Imagen-Prompts bereitgestellt wurde (weniger Aufnahmetraining). | Betreff mit Textkennung und 4–8 Bildern pro Betreff | Feinabstimmung des Modells (nach dem Training mit vom Nutzer bereitgestellten Betreff) | $ pro Knotenstunde Preise für benutzerdefiniertes Vertex AI-Training | |
Visuelle Untertitel | Kurze oder lange Textuntertitel für ein Bild generieren | Bild | Textunterschrift | 0,0015 $ pro Bild | |
Visual Fragen und Antworten | Eine Antwort basierend auf einer Frage bereitstellen, die auf ein Bild verweist | Bild-/Text-Prompt | Textantwort | 0,0015 $ pro Bild |
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Einbettung
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
multimodale Einbettung | Einbettungen für multimodale Attribute: Text | Einbettungen mit Text als Eingabe generieren | Text | Einbettungen | 0,0002 $ pro 1.000 Zeichen Eingabe |
Einbettungen für multimodale Ausdrücke: Bild | Einbettungen mit Bild als Eingabe generieren | Bild | Einbettungen | 0,0001 $ pro Bildeingabe | |
Einbettungen für multimodal: Video Plus | Video Plus | Video | Einbettungen (bis zu 15 Einbettungen pro Minute Video) | 0,0020 $ pro Sekunde Video | |
Einbettungen für multimodal: Video Standard | Video – Standard | Video | Einbettungen (bis zu 8 Einbettungen pro Minute Video) | 0,0010 $ pro Sekunde Video | |
Einbettungen für multimodal: Videos essenziell | Video Essentials | Video | Einbettungen (bis zu 4 Einbettungen pro Minute Video) | 0,0005 $ pro Sekunde Video |
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Einbettungen für Text | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Codevervollständigung
Die Generative AI in Vertex AI wird nach 1.000 Zeichen Eingabe (Eingabeaufforderung) und 1.000 Zeichen Ausgabe (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Während der Vorschauphase werden Gebühren zu 100 % reduziert. Vorhersageanfragen, die zu gefilterten Antworten nur für die Eingabe in Rechnung gestellt. Am Ende jedes Abrechnungszeitraums Bruchteile von einem Cent (0,01 $) werden auf einen Cent gerundet.
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Codey für Codevervollständigung | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Übersetzung (Text)
Verwenden Sie die Vertex AI API und Übersetzungs-LLM, um Text zu übersetzen. LLM-Übersetzungen sind in der Regel fließender und menschlicher als klassische Übersetzungsmodelle, bieten jedoch nur eingeschränkte Sprachunterstützung. Weitere Informationen
Modell | Methode | Nutzung | Preis pro Million Zeichen |
---|---|---|---|
LLM | SMS Übersetzung (Vorschau)* | Die Anzahl der Eingabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Die Anzahl der Ausgabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Preise sind in US-Dollar ($) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, werden die Preise in Ihrer Währung
Cloud Platform-SKUs
angewendet werden.
* Der Preis gilt pro Zeichen, das vom Modell verarbeitet wird. Weitere Informationen zu gezählten Zeichen findest du unter Gebührenpflichtige Zeichen
Kontext-Caching
Mit Kontext-Caching können Sie die Kosten für die Verarbeitung von Gemini-Eingabetokens senken um 75% und die Latenz bei der Inhaltsgenerierung durch das Caching des Kontextteils Text oder Medien in Gemini-Modelle ein. Die Dauer, über die Daten im der vom Nutzer gesteuert werden kann, bestimmt den "Kontext-Cache" Speicher“ Gebühren. Wenn Sie einen im Cache gespeicherten Kontext erstellen, werden Nutzern die standardmäßigen Kosten für Eingabetokens in Rechnung gestellt. Cache-Treffer für Eingabedaten werden zu einem reduzierten Preis (Cached Input) anstelle der normalen Eingabekosten abgerechnet. Die Datengröße für beide Speicher und Eingaben werden genauso berechnet wie die Gemini-Eingabepreise.
Modell | Feature | Typ | Preis ( =< 128.000 Kontextfenster) | Preis (> 128.000 Kontextfenster) |
---|---|---|---|---|
Gemini 1.5 Flash | Im Cache gespeicherte Eingabe | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,000005 / Bild 0,000005 / Sekunde 0,0000046875 / 1.000 Zeichen 0,0000005 / Sekunde |
0,00001 / Bild 0,00001 / Sekunde 0,000009375 / 1.000 Zeichen 0,000001 / Sekunde |
Kontext-Cache-Speicher | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,000263 / Bild / Std. 0,000263/ Sekunde / Std. 0,00025 / 1.000 Zeichen / Std. 0,000025 / Sekunde / Std. |
||
Gemini 1.5 Pro, | Im Cache gespeicherte Eingabe | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00032875 / Bild 0,00032875 / Sekunde 0,0003125 / 1.000 Zeichen 0,00003125 / Sekunde |
0,0006575 / Bild 0,0006575 / Sekunde 0,000625 / 1.000 Zeichen 0,0000625 / Sekunde |
Kontext-Cache-Speicher | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,0011835 / Bild / Std. 0,0011835/ Sekunde / Std. 0,001125 / 1.000 Zeichen / Std. 0,0001125 / Sekunde / Std. |
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Beispiel für die Berechnung der im Cache gespeicherten Kosten
Wenn ein Nutzer einen im Cache gespeicherten Kontext mit 250.000 Zeichen und einer TTL von 2 Stunden erstellt und anschließend innerhalb dieser 2 Stunden 20 separate Anfragen an das Gemini 1.5 Pro-Modell sendet und bei jeder Anfrage eine Abfrage mit 200 Zeichen zum Cache-Kontext und einer Ausgabe mit 400 Zeichen hinzugefügt wurde, wird die Gesamtkosten so berechnet:
Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost
5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.
Beispiel für die Kostenberechnung
Wenn ein Nutzer fünf separate Anfragen an das PaLM Text Bison-Modell sendet und jede Anfrage eine Eingabe mit 200 Zeichen und eine Ausgabe von 400 Zeichen hat, wird die Gesamtgebühr so berechnet:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Partnermodelle
Partnermodelle sind eine ausgewählte Liste von generativen KI-Modellen, die von Google-Partner Partnermodelle werden als verwaltete APIs angeboten. Weitere Informationen finden Sie unter Partnermodelle In der folgenden Tabelle sind die Preisangaben für Google-Partnermodelle aufgeführt:
Claude-Modelle von Anthropic
Modell | Preise |
---|---|
Claude 3.5 Sonnet | Eingabe: 3 $ / Millionen Tokens Ausgabe: 15 $ / Millionen Tokens |
Claude 3 Opus | Eingabe: 15 $ / Million Tokens Ausgabe: 75 $ / Millionen Tokens |
Claude 3 Haiku | Eingabe: 0,25 $ / Million Tokens Ausgabe: 1,25 $ / Millionen Tokens |
Claude 3 Sonnet | Eingabe: 3 $ / Millionen Tokens Ausgabe: 15 $ / Millionen Tokens |
Modelle von Mistral AI
Modell | Preise |
---|---|
Mistral Groß (2407) | Eingabe: 3 $ / Millionen Tokens Ausgabe: 9 $ / Millionen Tokens |
Mistral Nemo | Eingabe: 0,30 $ / Million Tokens Ausgabe: 0,30 $ / Millionen Tokens |
Codestral | Eingabe: 1 $ / Million Tokens Ausgabe: 3 $ / Millionen Tokens |