Vertex AI – Preise

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Auf dieser Seite werden die Preise für generative KI in Vertex AI beschrieben. Informationen zu allen anderen Vertex AI-Preisen, einschließlich ML Platform und MLOps-Dienste, finden Sie auf der Preisseite für Vertex AI.

Google-Modelle

Gemini

Mit den multimodalen Modellen in Vertex AI können Sie entweder Text oder Medien (Bilder, Videos) eingeben. Die Texteingabe wird nach jeweils 1.000 Eingaben (Prompt) und alle 1.000 Zeichen der Ausgabe (Antwort) berechnet. Die Zeichen werden von UTF-8-Codepunkten gezählt und Leerzeichen werden nicht berücksichtigt, sodass ungefähr 4 Zeichen pro Token entstehen. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur nach Eingabe berechnet. Am Ende jedes Abrechnungszeitraums werden Bruchteile von einem Cent (0, 01 $) auf einen Cent aufgerundet. Die Medieneingabe wird pro Bild oder pro Sekunde (Video) abgerechnet.

Modell Funktion Typ Preis
( =< 128.000 Eingabetokens)
Preis
(> 128.000 Eingabetokens)
Gemini 1.5 Flash Multimodal Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,00002 $ / Bild
0,00002 $ / Sekunde
0,00001875 $ / 1.000 Zeichen
0,000002 $ / Sekunde
0,00004 $ / Bild
0,00004 $ / Sekunde
0,0000375 $ / 1.000 Zeichen
0,000004 $ / Sekunde
Textausgabe 0,000075 $ / 1.000 Zeichen 0,00015 $ / 1.000 Zeichen
Abstimmung* Trainingstoken 8 $ / M Tokens
Gemini 1.5 Pro, Multimodal Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,00032875 $ / Bild
0,00032875 $ / Sekunde
0,0003125 $ / 1.000 Zeichen
0,00003125 $ / Sekunde
0,0006575 $ / Bild
0,0006575 $ / Sekunde
0,000625 $ / 1.000 Zeichen
0,0000625 $ / Sekunde
Textausgabe 0,00125 $ / 1.000 Zeichen 0,0025 $ / 1.000 Zeichen
Abstimmung* Trainingstoken 80 $ / M Tokens
Gemini 1.0 Pro Multimodal Bildeingabe
Videoeingabe
Texteingabe
0,0025 $ / Bild
0,002 $ / Sekunde
0,000125 $ / 1.000 Zeichen
Textausgabe 0,000375 $ / 1.000 Zeichen
Fundierung mit der Google Suche Text Fundierungsanfragen 35 $ pro 1.000 Anfragen (für bis zu 1 Million Anfragen pro Tag).
Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr
als eine Million Anfragen pro Tag benötigen.

* Die Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Wenn ein Abfragekontext länger als 128.000 ist, werden alle Tokens zu langen Kontextsätzen in Rechnung gestellt.
* Gemini-Modelle sind im Batchmodus mit 50% Rabatt verfügbar.
* Gemini 1.0 Pro unterstützt nur ein Kontextfenster von bis zu 32.000.
* PDFs werden als Bildeingabe abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Der Endpunkt des abgestimmten Modells hat denselben Vorhersagepreis wie das Basismodell.
* Fundierung mit der Google Suche: Wenn Sie zur Kostenoptimierung dynamisches Abrufen verwenden, werden nur Anfragen, die mindestens eine Fundierungs-Support-URL aus dem Web in ihrer Antwort enthalten, für die Fundierung mit der Google Suche in Rechnung gestellt. Es fallen immer Kosten für Gemini an.

Imagen

Mit Imagen in Vertex AI können Sie neue Bilder generieren und Bilder basierend auf von Ihnen bereitgestellten Text-Prompts bearbeiten oder nur Teile von Bildern bearbeiten, indem Sie einen von Ihnen definierten Maskenbereich und eine Reihe weiterer Funktionen verwenden.

Modell Feature Beschreibung Eingabe Ausgabe Preis
Bild 3 Bilderstellung Image generieren Text-Prompt Bild 0,04 $ pro Bild
Imagen 3 Schnell Bilderstellung Image generieren Text-Prompt Bild 0,02 $ pro Bild
Image 2, Imagen Bilderstellung Image generieren Text-Prompt Bild 0,020 $ pro Bild
Bildbearbeitung Bild mit maskenfreiem Ansatz oder Maskenansatz bearbeiten Bild-/Text-Prompt Bild 0,020 $ pro Bild
Auflösung wird erhöht Auflösung eines generierten Bildes auf 2.000 und 4.000 erhöhen Bild Bild 0,003 $ pro Bild
Optimierung Aktivieren Sie einen "Betreff", der vom Nutzer für die Verwendung von Imagen-Prompts bereitgestellt wurde (weniger Aufnahmetraining). Betreff mit Textkennung und 4–8 Bildern pro Betreff Feinabstimmung des Modells (nach dem Training mit vom Nutzer bereitgestellten Betreff) $ pro Knotenstunde Preise für benutzerdefiniertes Vertex AI-Training
Visuelle Untertitel Kurze oder lange Textuntertitel für ein Bild generieren Bild Textunterschrift 0,0015 $ pro Bild
Visual Fragen und Antworten Eine Antwort basierend auf einer Frage bereitstellen, die auf ein Bild verweist Bild-/Text-Prompt Textantwort 0,0015 $ pro Bild

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Einbettung

Modell Feature Beschreibung Eingabe Ausgabe Preis
multimodale Einbettung Einbettungen für multimodale Attribute: Text Einbettungen mit Text als Eingabe generieren Text Einbettungen 0,0002 $ pro 1.000 Zeichen Eingabe
Einbettungen für multimodale Ausdrücke: Bild Einbettungen mit Bild als Eingabe generieren Bild Einbettungen 0,0001 $ pro Bildeingabe
Einbettungen für multimodal: Video Plus Video Plus Video Einbettungen (bis zu 15 Einbettungen pro Minute Video) 0,0020 $ pro Sekunde Video
Einbettungen für multimodal: Video Standard Video – Standard Video Einbettungen (bis zu 8 Einbettungen pro Minute Video) 0,0010 $ pro Sekunde Video
Einbettungen für multimodal: Videos essenziell Video Essentials Video Einbettungen (bis zu 4 Einbettungen pro Minute Video) 0,0005 $ pro Sekunde Video
Modell Typ Region Preis pro 1.000 Zeichen
Einbettungen für Text Eingabe Global
  • Onlineanfragen: 0,000025 $
  • Batchanfragen: 0,00002 $
Ausgabe Global
  • Onlineanfragen: kostenlos
  • Batchanfragen: kostenlos

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Codevervollständigung

Die Generative AI in Vertex AI wird nach 1.000 Zeichen Eingabe (Eingabeaufforderung) und 1.000 Zeichen Ausgabe (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Während der Vorschauphase werden Gebühren zu 100 % reduziert. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe in Rechnung gestellt. Am Ende jedes Abrechnungszeitraums werden Bruchteile von einem Cent (0,01 $) auf einen Cent aufgerundet.

Modell Typ Region Preis pro 1.000 Zeichen
Codey für Codevervollständigung Eingabe Global
  • Onlineanfragen: 0,00025 $
Ausgabe Global
  • Onlineanfragen: 0,0005 $

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Übersetzung (Text)

Verwenden Sie die Vertex AI API und Übersetzungs-LLM, um Text zu übersetzen. LLM-Übersetzungen sind in der Regel fließender und menschlicher als klassische Übersetzungsmodelle, bieten jedoch nur eingeschränkte Sprachunterstützung. Weitere Informationen

Modell Methode Nutzung Preis pro Million Zeichen
LLM Textübersetzung (Vorschau)* Die Anzahl der Eingabezeichen pro Monat

10 $ pro 1 Million Zeichen*

Die Anzahl der Ausgabezeichen pro Monat

10 $ pro 1 Million Zeichen*

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Der Preis gilt pro Zeichen, das vom Modell verarbeitet wird. Weitere Informationen zu gezählten Zeichen findest du unter Gebührenpflichtige Zeichen.

Kontext-Caching

Mit Kontext-Caching können Sie die Kosten für die Verarbeitung von Gemini-Eingabetokens um 75% und die Latenz der Inhaltsgenerierung reduzieren, indem Sie den Kontextteil Ihres Eingabetexts oder der Medien in Gemini-Modellen im Cache speichern. Die Dauer der Speicherung von Daten im Cache, die vom Nutzer gesteuert werden kann, bestimmt die Kosten für den Kontext-Cache-Speicher. Wenn Sie einen im Cache gespeicherten Kontext erstellen, werden Nutzern die standardmäßigen Kosten für Eingabetokens in Rechnung gestellt. Cache-Treffer für Eingabedaten werden zu einem reduzierten Preis (Cached Input) anstelle der normalen Eingabekosten berechnet. Die Datengröße für Speicher und Eingabe wird auf dieselbe Weise wie die Gemini-Eingabepreise berechnet.

Modell Feature Typ Preis ( < 128.000 Eingabetokens) Preis (> 128.000 Eingabetokens)
Gemini 1.5 Flash Im Cache gespeicherte Eingabe Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,000005 / Bild
0,000005 / Sekunde
0,0000046875 / 1.000 Zeichen
0,0000005 / Sekunde
0,00001 / Bild
0,00001 / Sekunde
0,000009375 / 1.000 Zeichen
0,000001 / Sekunde
Kontext-Cache-Speicher Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,000263 / Bild / Std.
0,000263/ Sekunde / Std.
0,00025 / 1.000 Zeichen / Std.
0,000025 / Sekunde / Std.
Gemini 1.5 Pro, Im Cache gespeicherte Eingabe Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,0000821875 / Bild
0,0000821875 / Sekunde
0,000078125 / 1.000 Zeichen
0,0000078125 / Sekunde
0,000164375 / Bild
0,000164375 / Sekunde
0,00015625 / 1.000 Zeichen
0,000015625 / Sekunde
Kontext-Cache-Speicher Bildeingabe
Videoeingabe
Texteingabe
Audioeingabe
0,0011835 / Bild / Std.
0,0011835/ Sekunde / Std.
0,001125 / 1.000 Zeichen / Std.
0,0001125 / Sekunde / Std.

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Beispiel für die Berechnung der im Cache gespeicherten Kosten

Wenn ein Nutzer einen im Cache gespeicherten Kontext mit 250.000 Zeichen und einer TTL von 2 Stunden erstellt und anschließend innerhalb dieser zwei Stunden 20 separate Anfragen an das Gemini 1.5 Pro-Modell sendet und bei jeder Anfrage eine Abfrage mit 200 Zeichen zum Cache-Kontext und einer Ausgabe mit 400 Zeichen hinzugefügt wurde, wird die Gesamtkosten so berechnet:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Beispiel für die Kostenberechnung

Wenn ein Nutzer fünf separate Anfragen an das PaLM Text Bison-Modell sendet und jede Anfrage eine Eingabe mit 200 Zeichen und eine Ausgabe von 400 Zeichen hat, wird die Gesamtgebühr so berechnet:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Partnermodelle

Partnermodelle sind eine ausgewählte Liste von generativen KI-Modellen, die von Google-Partnern entwickelt wurden. Partnermodelle werden als verwaltete APIs angeboten. Weitere Informationen finden Sie in der Übersicht über Partnermodelle. In den folgenden Abschnitten finden Sie Einzelheiten zu den Preisen für Google-Partnermodelle.

Modelle von AI21 Lab

Modell Preise
Jamba 1.5 Large Eingabe: 2 $ / Million Tokens
Ausgabe: 8 $ / Millionen Tokens
Jamba 1.5 Mini Eingabe: 0,20 $ / Million Tokens
Ausgabe: 0,40 $ / Millionen Tokens

Claude-Modelle von Anthropic

Modell Preise
Claude 3.5 Haiku Eingabe: 1,00 $ / Million Tokens
Ausgabe: 5,00 $ / Millionen Tokens
Claude 3.5 Sonnet v2 Eingabe: 3 $ / Millionen Tokens
Ausgabe: 15 $ / Millionen Tokens
Claude 3.5 Sonett Eingabe: 3 $ / Millionen Tokens
Ausgabe: 15 $ / Millionen Tokens
Claude 3 Haiku Eingabe: 0,25 $ / Million Tokens
Ausgabe: 1,25 $ / Millionen Tokens
Claude 3 Sonnet Eingabe: 3 $ / Millionen Tokens
Ausgabe: 15 $ / Millionen Tokens
Claude 3 Opus Eingabe: 15 $ / Million Tokens
Ausgabe: 75 $ / Millionen Tokens

Lama-Modelle von Meta

Modell Preise
Llama 3.1 405B Eingabe: 5 $ / Millionen Tokens
Ausgabe: 16 $ / Millionen Tokens

Modelle von Mistral AI

Modell Preise
Mistral Groß (2407) Eingabe: 2 $ / Million Tokens
Ausgabe: 6 $ / Millionen Tokens
Mistral Nemo Eingabe: 0,15 $ / Million Tokens
Ausgabe: 0,15 $ / Millionen Tokens
Codestral Eingabe: 0,20 $ / Million Tokens
Ausgabe: 0,60 $ / Millionen Tokens

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.
Vertrieb kontaktieren