Vertex AI – Preise
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Auf dieser Seite sind die Preise für Generative AI in Vertex AI beschrieben. Informationen zu allen anderen Preisen für Vertex AI, einschließlich der ML Platform- und MLOps-Dienste, finden Sie auf der Preisübersicht zu Vertex AI.
Google-Modelle
Gemini
Mit den multimodalen Modellen in Vertex AI können Sie entweder Text oder Medien (Bilder, Video) eingeben. Texteingaben werden pro 1.000 Eingabezeichen (Prompt) und pro 1.000 Ausgabezeichen (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Das ergibt etwa 4 Zeichen pro Token. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Brüche von einem Cent (0, 01 $) auf einen Cent aufgerundet. Die Medieneingabe wird pro Bild oder Sekunde (Video) berechnet.
Modell | Funktion | Typ | Preis ( =< 128.000 Eingabetokens) |
Preis (> 128.000 Eingabe-Token) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00002 $ / Bild 0,00002 $ / Sekunde 0,00001875 $ / 1.000 Zeichen 0,000002 $ / Sekunde |
0,00004 $ / Bild 0,00004 $ / Sekunde 0,0000375 $ / 1.000 Zeichen 0,000004 $ / Sekunde |
Textausgabe | 0,000075 $ / 1.000 Zeichen | 0,00015 $ pro 1.000 Zeichen | ||
Tuning* | Training-Token | 8 $ / Mio. Tokens | ||
Gemini 1.5 Pro, | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00032875 $ / Bild 0,00032875 $ / Sekunde 0,0003125 $ / 1.000 Zeichen 0,00003125 $ / Sekunde |
0,0006575 $ / Bild 0,0006575 $ / Sekunde 0,000625 $ / 1.000 Zeichen 0,0000625 $ / Sekunde |
Textausgabe | 0,00125 $ / 1.000 Zeichen | 0,0025 $ pro 1.000 Zeichen | ||
Tuning* | Training-Token | 80 $ pro Mio. Tokens | ||
Gemini 1.0 Pro | Multimodal | Bildeingabe Videoeingabe Texteingabe |
0,0025 $ / Bild 0,002 $ / Sekunde 0,000125 $ / 1.000 Zeichen |
|
Textausgabe | 0,000375 $ / 1.000 Zeichen | |||
Fundierung mit der Google Suche | Text | Fundierte Anfragen | 35 $ pro 1.000 Anfragen (für bis zu 1 Mio. Anfragen pro Tag). Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als 1 Million Anfragen pro Tag benötigen. |
* Preise sind in US-Dollar ($) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Wenn der Abfragekontext länger als 128.000 Token ist, werden alle Tokens zum Preis für lange Kontexte berechnet.
* Gemini-Modelle sind im Batch-Modus mit 50% Rabatt verfügbar.
* Gemini 1.0 Pro unterstützt nur ein Kontextfenster mit bis zu 32.000 Tokens.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells wird derselbe Preis für Vorhersagen wie für das Basismodell berechnet.
* Grounding mit der Google Suche: Wenn Sie dynamischen Abruf verwenden, um die Kosten zu optimieren, werden nur Anfragen für Grounding mit der Google Suche berechnet, die mindestens eine URL für die Unterstützung von Grounding aus dem Web in der Antwort enthalten. Für Gemini fallen immer Kosten an.
Imagen
Mit Imagen in Vertex AI können Sie neue Bilder generieren und Bilder basierend auf den von Ihnen bereitgestellten Text-Prompts bearbeiten oder nur Teile von Bildern mit einem Maskenbereich, den Sie zusammen mit einer Reihe anderer Funktionen definieren, bearbeiten.
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Bild 3 | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,04 $ pro Bild |
Imagen 3 Schnell | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,02 $ pro Bild |
Imagen 2, Imagen | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,020 $ pro Bild |
Bildbearbeitung | Bild mit maskenfreiem Ansatz oder Maskenansatz bearbeiten | Bild-/Text-Prompt | Bild | 0,020 $ pro Bild | |
Auflösung wird erhöht | Auflösung eines generierten Bildes auf 2.000 und 4.000 erhöhen | Bild | Bild | 0,003 $ pro Bild | |
Optimierung | Aktivieren Sie einen "Betreff", der vom Nutzer für die Verwendung von Imagen-Prompts bereitgestellt wurde (weniger Aufnahmetraining). | Betreff mit Textkennung und 4–8 Bildern pro Betreff | Feinabstimmung des Modells (nach dem Training mit vom Nutzer bereitgestellten Betreff) | $ pro Knotenstunde Preise für benutzerdefiniertes Vertex AI-Training | |
Visuelle Untertitel | Kurze oder lange Textuntertitel für ein Bild generieren | Bild | Textunterschrift | 0,0015 $ pro Bild | |
Visual Fragen und Antworten | Eine Antwort basierend auf einer Frage bereitstellen, die auf ein Bild verweist | Bild-/Text-Prompt | Textantwort | 0,0015 $ pro Bild |
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Einbettung
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Multimodale Embeddings | Einbettungen für multimodale Attribute: Text | Einbettungen mit Text als Eingabe generieren | Text | Einbettungen | 0,0002 $ pro 1.000 Zeichen Eingabe |
Einbettungen für multimodale Ausdrücke: Bild | Einbettungen mit Bild als Eingabe generieren | Bild | Einbettungen | 0,0001 $ pro Bildeingabe | |
Einbettungen für multimodal: Video Plus | Video Plus | Video | Einbettungen (bis zu 15 Einbettungen pro Minute Video) | 0,0020 $ pro Sekunde Video | |
Einbettungen für multimodale Ausdrücke: Video-Standard | Video – Standard | Video | Einbettungen (bis zu 8 Einbettungen pro Minute Video) | 0,0010 $ pro Sekunde Video | |
Einbettungen für multimodale Ausdrücke: Video – Grundlegend | Video Essentials | Video | Einbettungen (bis zu 4 Einbettungen pro Minute Video) | 0,0005 $ pro Sekunde Video |
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Einbettungen für Text | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Codevervollständigung
Die Generative AI in Vertex AI wird nach 1.000 Zeichen Eingabe (Eingabeaufforderung) und 1.000 Zeichen Ausgabe (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Während der Vorschauphase werden Gebühren zu 100 % reduziert. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Brüche von einem Cent (0,01 $) auf einen Cent aufgerundet.
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Codey für Codevervollständigung | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Übersetzung (Text)
Verwenden Sie die Vertex AI API und Übersetzungs-LLM, um Text zu übersetzen. LLM-Übersetzungen klingen im Vergleich zu klassischen Übersetzungsmodellen oft natürlicher und flüssiger, bieten aber eine eingeschränktere Sprachunterstützung (Weitere Informationen).
Modell | Methode | Nutzung | Preis pro 1 Million Zeichen |
---|---|---|---|
LLM | Textübersetzung (Vorschau)* | Die Anzahl der Eingabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Anzahl der Ausgabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Preise sind in US-Dollar ($) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Der Preis bezieht sich auf die Anzahl der Zeichen, die vom Modell verarbeitet werden. Weitere Informationen zu gezählten Zeichen finden Sie unter Gebührenpflichtige Zeichen.
Kontext-Caching
Mit dem Kontext-Caching können Sie die Kosten für die Verarbeitung von Gemini-Eingabetoken um 75% und die Latenzzeit bei der Inhaltserstellung reduzieren, indem Sie den Kontextteil Ihres Eingabetexts oder -mediums in Gemini-Modellen zwischenspeichern. Die Dauer, für die Daten im Cache gespeichert werden, kann vom Nutzer festgelegt werden. Sie bestimmt die Gebühren für „Context Cache Storage“. Beim Erstellen eines zwischengespeicherten Kontexts werden den Nutzern die Kosten für ein Standard-Eingabetoken in Rechnung gestellt. Cache-Treffer bei Eingabedaten werden mit einem reduzierten Preis, „Cached Input“, anstatt mit den normalen Eingabekosten berechnet. Die Datengröße für Speicher und Eingabe wird auf dieselbe Weise berechnet wie die Preise für Gemini-Eingabe.
Modell | Feature | Typ | Preis ( ≤ 128.000 Eingabe-Token) | Preis (> 128.000 Eingabe-Token) |
---|---|---|---|---|
Gemini 1.5 Flash | Zwischengespeicherte Eingabe | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,000005 € / Bild 0,000005 € / Sekunde 0,0000046875 € / 1.000 Zeichen 0,0000005 € / Sekunde |
0,00001 $ / Bild 0,00001 $ / Sekunde 0,000009375 $ / 1.000 Zeichen 0,000001 $ / Sekunde |
Kontextcache-Speicher | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,000263 $ / Bild / Stunde 0,000263 $/ Sekunde / Stunde 0,00025 $ / 1.000 Zeichen / Stunde 0,000025 $ / Sekunde / Stunde |
||
Gemini 1.5 Pro, | Zwischengespeicherte Eingabe | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,0000821875 € / Bild 0,0000821875 € / Sekunde 0,000078125 € / 1.000 Zeichen 0,0000078125 € / Sekunde |
0,000164375 $ / Bild 0,000164375 $ / Sekunde 0,00015625 $ / 1.000 Zeichen 0,000015625 $ / Sekunde |
Kontextcache-Speicher | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,0011835 $ / Bild / Stunde 0,0011835 $/ Sekunde / Stunde 0,001125 $ / 1.000 Zeichen / Stunde 0,0001125 $ / Sekunde / Stunde |
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Beispiel für die Berechnung der zwischengespeicherten Kosten
Wenn ein Nutzer einen zwischengespeicherten Kontext mit 250.000 Zeichen und einer TTL von 2 Stunden erstellt und anschließend innerhalb dieser 2 Stunden zwanzig separate Anfragen an das Gemini 1.5 Pro-Modell sendet,wobei jeder Anfrage eine Abfrage mit 200 Zeichen hinzugefügt wird, die zu einem zwischengespeicherten Kontext mit einer Ausgabe von 400 Zeichen führt, wird die Gesamtgebühr wie folgt berechnet:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Beispiel für die Kostenberechnung
Wenn ein Nutzer fünf separate Anfragen an das PaLM Text Bison-Modell sendet und jede Anfrage eine Eingabe mit 200 Zeichen und eine Ausgabe von 400 Zeichen hat, wird die Gesamtgebühr so berechnet:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Partnermodelle
Partnermodelle sind eine ausgewählte Liste generativer KI-Modelle, die von Google-Partnern entwickelt wurden. Partnermodelle werden als verwaltete APIs angeboten. Weitere Informationen finden Sie unter Partnermodelle – Übersicht. In den folgenden Abschnitten finden Sie die Preisdetails für Google-Partnermodelle.
Modelle von AI21 Lab
Modell | Preise |
---|---|
Jamba 1.5 Large | Eingabe: 2 $ pro Million Tokens Ausgabe: 8 $ pro Million Tokens |
Jamba 1.5 Mini | Eingabe: 0,20 $ / Million Tokens Ausgabe: 0,40 $ / Million Tokens |
Claude-Modelle von Anthropic
Modell | Preise |
---|---|
Claude 3.5 Haiku | Eingabe: 1,00 $ pro Million Tokens Ausgabe: 5,00 $ pro Million Tokens |
Claude 3.5 Sonnet v2 | Eingabe: 3 $ pro Million Tokens Ausgabe: 15 $ pro Million Tokens |
Claude 3.5 Sonett | Eingabe: 3 $ pro Million Tokens Ausgabe: 15 $ pro Million Tokens |
Claude 3 Haiku | Eingabe: 0,25 $ pro Million Tokens Ausgabe: 1,25 $ pro Million Tokens |
Claude 3 Sonnet | Eingabe: 3 $ pro Million Tokens Ausgabe: 15 $ pro Million Tokens |
Claude 3 Opus | Eingabe: 15 $ pro 1 Million Token Ausgabe: 75 $ pro 1 Million Token |
Llama-Modelle von Meta
Modell | Preise |
---|---|
Llama 3.1 405B | Eingabe: 5,00 $ pro Million Tokens Ausgabe: 16,00 $ pro Million Tokens |
Mistral AI-Modelle
Modell | Preise |
---|---|
Mistral Large (24.11) | Eingabe: 2,00 $ / Million Tokens Ausgabe: 6,00 $ / Million Tokens |
Mistral Large (24.07) | Eingabe: 2,00 $ / Million Tokens Ausgabe: 6,00 $ / Million Tokens |
Mistral Nemo | Eingabe: 0,15 $ / Million Tokens Ausgabe: 0,15 $ / Million Tokens |
Codestral (24.05.) | Eingabe: 0,20 $ / Million Token Ausgabe: 0,60 $ / Million Token |