Vertex AI Agent Builder – Preise

Preise sind in US-Dollar ($) angegeben.

Die Preise für die aufgeführten GA-Funktionen wurden am 1. September 2023 aufgerufen.

Mit Vertex AI Agent Builder können auch Entwickler mit geringen ML-Kenntnissen die Vorteile von der Basis: Large Language Models, Suchkompetenz und Conversational AI-Technologien von Google, Generative AI-Anwendungen für Unternehmen

Guthaben für Testversionen und Support

Für die Verwendung mit Vertex AI Agent Builder wird ein KOSTENLOSES Guthaben von 1.000$ gewährt. Dieses Guthaben ist ab der Kontoregistrierung bei Vertex AI Agent Builder ab dem 18. Juli 2023 für 1 Jahr gültig.

Haben Sie Fragen zu den Google Analytics-Funktionen oder zur Paketerstellung und Preisgestaltung für die Vorschaufunktionen?

Weitere Informationen erhalten Sie von Ihrem Google Cloud-Vertriebsteam .

Vertex AI Agents – Preise

Mit Vertex AI Agent Builder können Sie schnell virtuelle Kundenservicemitarbeiter (Chatbots) erstellen, die auf der Grundlage von Inhalten (Website, Dokumente) Antworten generieren die Sie in Datenspeicher aufnehmen. Mit Vertex AI-Agents können Sie einen neuen Dialogflow CX erstellen virtueller Kundenservicemitarbeiter ODER fügen Sie die Funktion einem vorhandenen virtuellen Dialogflow CX-Kundenservicemitarbeiter hinzu.

Wenn Sie Ihren virtuellen Kundenservicemitarbeitern in Dialogflow CX zusätzliche Funktionen für Generative AI hinzufügen möchten, können Sie generative Fallbacks nutzen, die mithilfe eines Large Language Model (LLM) problemlos Szenarien bewältigen, bei denen es keine Übereinstimmung mit dem Intent des Nutzers gibt. Generatoren ermöglichen es Ihren Bot-Buildern, generative Aktionen überall in Ihren Konversationsfluss einzubinden – z. B. um eine Unterhaltung zusammenzufassen, eine Interaktion zu personalisieren oder mehrere LLM-Aufrufe miteinander zu verketten, um einen gesamten generativen Workflow zu erstellen.

Preise für GA-Funktionen von Vertex AI Agents

Chat mit Vertex AI-Kundenservicemitarbeitern* 12,00 $ / 1.000 Suchanfrage**
Vertex AI Agents Voice* 0,002 $ / Sekunde†
Dialogflow CX Chat***(Standardfunktionen, nicht generative KI für Chat) 7,00 $ / 1.000 Suchanfrage**
Dialogflow CX Voice***(Standardfunktionen, nicht generative KI für Voice) 0,001 $ / Sekunde†
* Alle Generative AI-Funktionen: Für Datenspeicher-Agents, Generative Fallbacks, Generatoren und Agent-Apps gelten die Preise für Vertex AI-Agents für Chats und Voice. Wenn Sie mehrere Arten von generativen KI-Funktionen in einer einzigen Anfrage verwenden, werden Ihnen die einzelnen Funktionen entsprechend ihrer Nutzung separat in Rechnung gestellt.

* Kunden können Abfragen/Sekunden für Dialogflow CX (nicht generativ) und Vertex AI Agents (generativ) im selben Agent oder Ablauf kombinieren. Die tatsächliche Nutzung jedes Featuresets wird automatisch in Rechnung gestellt. So können Sie Generative AI selektiv nutzen und zahlen nur für das, was Sie tatsächlich nutzen.

** Anfrage (oder Anfrage): Die Abrechnung wird pro Anfrage oder Anfrage berechnet.
Eine Anfrage oder Abfrage ist definiert als ein API-Aufruf an den Dialogflow- oder Vertex AI-Agents-Dienst, entweder direkt mit der API oder indirekt mit Einbindung oder Konsolennutzung.
Beispiel: Ein Nutzer stellt einem virtuellen Kundenservicemitarbeiter (Chatbot) eine Frage und der Chatbot antwortet 1 Anfrage. Eine Nutzerinteraktion mit dem Chatbot kann aus mehreren Anfragen bestehen, um eine Aufgabe auszuführen.

† Einschließlich Spracherkennung, Spracherkennung, Sprachsynthese, Sprachausgabe und Telefonie. Die gesamte in Rechnung gestellte Audioverarbeitungsdauer ist unabhängig von einer kostenlosen Verarbeitung ohne Audio (API-Latenz, Webhook-Verarbeitung usw.), die vor, während oder nach der Audioverarbeitung stattfinden kann.

* Für Dialogflow CX Chat und Dialogflow CX Voice ist kein Guthaben von 1.000 $für den kostenlosen Testzeitraum verfügbar. Dialogflow CX bietet ein zusätzliches Guthabenprogramm für den Testzeitraum, das mit diesem KOSTENLOSEN Testguthabenprogramm von Vertex AI Agent Builder kombiniert werden kann. Weitere Definitionen zum Dialogflow CX-Metering

Preisbeispiel für die GA-Funktionalität von Vertex AI Agents

Beispiel für die Kombination von absichtsbasierten und generativen Antworten: Kundensupport auf der Website

  • Für einige kundenspezifische Fragen (Abrechnung, Zahlung) werden absichtsbasierte, deterministische Abläufe verwendet.
  • Generative Antworten zur Beantwortung von Fragen, bei denen keine Absicht definiert wurde, die Antwort aber auf der Website zu finden ist

Annahmen:

  • 100 Mio. Websitebesuche pro Jahr
  • 5% der Besucher verwenden den Chatbot, 3 Abfragen pro Nutzung, 50% generativ, 50% absichtsbasiert
SKU-Volumen Preis Gesamtpreis
Dialogflow CX-Chat (Intent-basiert)
7,5 Mio.jährlich
100 Mio. × 5% Nutzung × 3 Abfragen × 50% absichtsbasiert
* 7,00 $ / 1.000 Abfragen = 52.500 $
Dialogflow CX Enterprise Chat (generativ)
7,5 Mio.jährlich
100 Mio. × 5% Nutzung × 3 Abfragen × 50% generativ
* 12,00 $ / 1.000 Abfragen = 90.000 $
Daten indexiert
50 GB jährlich
10 GB kostenlos, sodass 40 GB zur Preisberechnung verwendet werden
* 5,00 $ / GB × 12 Monate = 2.400 $

Vertex AI Search – Preise

Mit Vertex AI Agent Builder können Sie schnell Suchmaschinen für Websites, unstrukturierte Daten und strukturierte Daten erstellen, um Informationen abzurufen und fundierte Antworten zu generieren. Weitere Informationen zu den in Vertex AI Search verfügbaren Funktionen

Preise für die GA-Funktionen von Vertex AI Search

Suche in Standard Edition* 2,00 $ / 1.000 Anfrage
Search Enterprise Edition* 4,00 $ / 1.000 Suchanfrage
LLM-Add-on für die einfache Suche** +4 $ / 1.000 Suchanfrage durch Nutzereingabe**
LLM-Add-on für die erweiterte Suche** +10 $ / 1.000 Suchanfrage durch Nutzereingabe**
Search Standard Edition – unstrukturierte Suchfunktionen
Search Enterprise Edition – unstrukturierte Suche und Website-Suche
LLM-Add-on für die einfache Suche** – Bietet Antworten und Zusammenfassungen für einfache Einzel- oder Multi-Turn-Anfragen mit der Möglichkeit, einfache oder kumulierende Abfragen, lange und mehrere Rundenabfragen zu verarbeiten, unterstützt Modelle wie TextBison, Gemini 1.0 Series, Gemini 1.5 Flash (Link)
LLM-Add-on für die erweiterte Suche** (derzeit öffentliche Vorschau, ab 1. Juli 2024 allgemein verfügbar) – Hier können Sie Antworten und Zusammenfassungen für Multi-Hop-Anfragen bereitstellen, z. B. eine Abfrage mit zwei oder mehr verschachtelten Fragen, die eine Klärung der nächsten Frage enthalten, die oft beantwortet werden muss. Unterstützung von Modellen wie TextBison, Gemini 1.0 Series und Gemini 1.5 Flash (Link). Die Abrechnung erfolgte nach der Anzahl der Nutzereingabeabfragen, nicht nach der Anzahl der Hops.
Private Vorschau – strukturierte Suche + neue generative KI-Funktionen (aktuelle Funktionen erhalten Sie vom Vertrieb)

*Query: Abrechnung pro einzelner Anfrage oder Suchanfrage
Eine Anfrage oder Anfrage wird als jeder API-Aufruf an Enterprise Search definiert, sei es direkt mit der API oder indirekt mit Einbindung oder Konsolennutzung.
Beispiel: Ein Nutzer stellt eine Frage in natürlicher Sprache und die Suchmaschine antwortet 1 Suchanfrage.

** Das LLM-Add-on ist wird einer Abfrage hinzugefügt, um die Verarbeitung um die Verwendung einer generativen KI zu erweitern Funktion,
Das LLM-Add-on kann austauschbar mit der Search Standard Edition oder der Search Enterprise Edition verwendet werden.
Beispiel: Ausführung einer Search Enterprise-Abfrage mit einer Zusammenfassungsanfrage = 1 Search Enterprise-Abfrage + 1 LLM-Add-on-Abfrage

Preisbeispiel für die GA-Funktion von Vertex AI Search

Beispiel für unstrukturierte Daten : Dokumentsuche

Annahme:

  • 10 Millionen Abfragen für die Standard Edition jährlich
  • 10 Mio. Enterprise Edition-Abfragen mit 10 Mio. LLM-Zusammenfassungsabfragen jährlich
  • 100.000 Dokumente mit jeweils ~1 MB
SKU-Volumen Preis Gesamtpreis
Standardsuche
10 Mio. jährlich * 2,00 $ / 1.000 Abfragen = 20.000 $
Google Suche für Unternehmen
10 Mio. jährlich * 4,00 $ / 1.000 Abfragen = 40.000 $
LLM-Add-on für die einfache Suche
Jede Abfrage, die der Standard- oder Enterprise-Abfrage hinzugefügt wird
10 Mio. jährlich * +4,00 $ / 1.000 Suchanfragen durch Nutzereingabe = über 40.000 $
LLM-Add-on für die erweiterte Suche
Jede Abfrage, die der Standard- oder Enterprise-Abfrage hinzugefügt wird
10 Mio. jährlich * +10,00 $ / 1.000 Suchanfragen von Nutzern = über 100.000 $
Daten indexiert
100 GB jährlich 10 GB kostenlos, sodass 90 GB zur Preisberechnung verwendet werden * 5,00 $ / GB × 12 Monate = 5.400 $

Preise für Datenindex

Preise für den Vertex AI Agent Builder Index-Datenspeicher

Daten indexiert 5,00 $ / GiB pro Monat
* Kostenloses Kontingent von 10 GiB pro Monat bereitgestellt
** Für Vertex AI Agent Builder freigegeben
*** Der Speicherplatz wird als 500 Kibibyte (KiB) * Anzahl der Seiten auf der Website berechnet. wobei 1 KiB 1.024 Byte entspricht. (500 KiB entspricht ~0,000477 GiB; die Datenindexierung ist also kostet eine Website mit 1000 Seiten 2,38 US-Dollar pro Monat.)

Preise für Vertex AI Search for Healthcare

Mit Vertex AI Search for Healthcare können Sie schnell medizinisch abgestimmte Suchmaschinen für Gesundheitsdaten erstellen.

Gesundheitssuche 20,00 $ / 1.000 Anfrage

Vertex AI Search for Healthcare enthält einige Features in der Vorabversion, z. B. Antworten auf Generative AI, Streaming von Aktualisierungen im Index und andere. Die Preise für diese Funktionen können sich vom aktuellen Listenpreis unterscheiden, wenn sie allgemein verfügbar sind.

Annahme:

  • 1.000.000 Suchanfragen im Gesundheitswesen pro Monat

  • 1.000 GiB an Gesundheitsdaten indexiert

SKU-Volumen Preis Gesamtpreis
1.000.000 Suchanfragen 20/1000 $ 20.000 $
1.000 GiB 5 $/GiB 5.000 $

Vertex AI Search for Media – Preise

Mit Vertex AI Search for Media können Sie hoch relevante Videoergebnisse bereitstellen. Nutzen Sie dazu die Abfrage und das Kontextverständnis von Google, um die Auffindbarkeit auf Ihrer Medienwebsite zu verbessern.

Vertex AI Agent Builder: Datenindex 5,00 $ / GB pro Monat
Vertex AI Search: Anzahl der Media Search API-Anfragen 2,00 $ / 1.000 Anfrage

Preise für Vertex AI Search for Media Recommendations

Die einzigen Vorgänge für Medienempfehlungen, für die Gebühren anfallen, sind Training, Feinabstimmung oder Vorhersageanfrage durch Aufrufen der Methode recommend. Für das Importieren oder Verwalten von Nutzerereignissen oder Dokumentinformationen fallen keine Kosten an.

Trainingskosten (pro Knoten und Stunde) werden täglich in Rechnung gestellt, wenn Ihr Modell aktiv trainiert wird oder wenn Sie eine Anfrage zum Fortsetzen des Trainings gesendet haben. Wenn Sie ein Modell pausieren oder löschen, fallen keine Kosten mehr an. Weitere Informationen finden Sie in der Dokumentation zum Verwalten von Trainings.

Die Kosten für die Feinabstimmung (pro Knoten und Stunde) für aktive Modelle werden berechnet, nachdem die Feinabstimmung erfolgreich abgeschlossen wurde. Ihnen werden nur dann unvollständige Feinabstimmungen in Rechnung gestellt, wenn Sie ein Modell während einer laufenden Feinabstimmung pausieren oder löschen. In diesem Fall werden Ihnen die Knotenstunden in Rechnung gestellt, die bis zum Beenden der Modellabstimmung verbraucht wurden. Weitere Informationen finden Sie in der Dokumentation zum Verwalten der Abstimmung.

Vorhersageanfragen pro Monat Preis pro 1.000 Vorhersagen
Maximal 20.000.000 0,27 $
Nächste 280.000.000 0,18 $
Ab 300.000.000 0,10 $
Feature Preis
Training und Feinabstimmung 2,50 $ pro Knoten und Stunde

Preisbeispiel für Medienempfehlungen

Annahme:

  • 1.000.000.000 Vorhersageanfragen pro Monat

  • Trainiert ein einzelnes Modell pro Tag, das automatisch einmal am Tag neu trainiert wird

  • Bezieht sich auf etwa 500 Knotenstunden für das Modelltraining und 100 Stunden für die Modellabstimmung pro Monat

SKU-Volumen Preis Gesamtpreis
Erste 20 Mio. Vorhersagen * 0,27 $ / 1.000 Vorhersagen = 5.400 $
Nächste 280 Mio. Vorhersagen * 0,18 $ / 1.000 Vorhersagen = 50.400 $
Nächste 700 Mio. Vorhersagen * 0,10 $ / 1.000 Vorhersagen = 70.000 $
500 Knotenstunden (Training) * 2,50 $ / Stunde = 1.250 $
100 Knotenstunden (Abstimmung) * 2,50 $ / Stunde = 250 $
Gesamt 127.300 $

Gebühren für Google Cloud Observability

Media Recommendations protokolliert für jede API-Anfrage, die zu einem Fehler führt, z. B. eine Nutzerereignisanfrage, die fehlerhafte JSON-Daten enthält, oder eine Dokumentimportanfrage mit einem negativen Preis. Media Recommendations protokolliert außerdem für jede Vorhersageanfrage einen Fehler mit einem Dokument, das nicht im importierten Datenspeicher enthalten ist.

Bei der Beobachtbarkeit von Google Cloud werden die Kosten nach dem GiB an gespeicherten Logs und für die Aufbewahrung über die standardmäßige Aufbewahrungsdauer. Weitere Informationen zum kostenlose Kontingente und Datenaufbewahrung finden Sie unter Google Cloud Observability – Preise

Die Größe der Logging-Daten hängt von der Größe der JSON-Nutzlast ab. aber ein GiB wären ungefähr 200.000 Fehler aufgrund von Medienempfehlungen.

Grounded Generation API – Preise

Mit der Grounded Generation API kannst du mithilfe von Informationen aus der Google Suche oder deinen eigenen Daten generative Antworten auf deine Prompts erstellen.

Eingabeaufforderung (umfasst Nutzeraufforderungen, Systemanweisungen und Inline-Fakten) Abgerechnet zum Preis des ausgewählten Gemini-Modells.
Ausgabe Abgerechnet zum Preis des ausgewählten Gemini-Modells.
Gegründete Generierung für die Fundierung Ihrer eigenen abgerufenen Daten 2,50 $ / 1.000 Anfragen
Gegründete Generierung als Fundament für die Google Suche Siehe Fundierung der Google Suche.
Die zusätzlichen Gebühren für den Datenabruf richten sich nach dem ausgewählten Abrufsystem (z.B. Vertex AI Search).

Beispiel 1: Fundierung in Vertex AI Search und Inline-Funding

Der Nutzer verwendet Vertex AI Search und zusätzliche fundierte Fakten, um fundierte Antworten zu generieren. Jeder Eingabe-Prompt hat 2.500 Zeichen (einschließlich Inline-Fakten) und jeder Ausgabe-Prompt 200 Zeichen. Der Nutzer hat Gemini 1.5 Flash ausgewählt.

Volumen pro Anfrage Preis pro 1.000 Anfragen
Prompt 2.500 Zeichen 1.000 Anfragen × 0,000125 $ pro 1.000 Zeichen × 2.500 Zeichen pro Anfrage = 0,3125$pro 1.000 Anfragen
Ausgabe 200 Zeichen 1.000 Anfragen × 0,000375 $ pro 1.000 Zeichen × 2 Zeichen pro Anfrage = 0,075$pro 1.000 Anfragen
Gegründete Generierung für die Fundierung Ihrer eigenen abgerufenen Daten 1 Anfrage 2,50$pro 1.000 Anfragen
Datenabruf: Vertex AI Search (Enterprise Edition) 1 Anfrage 4$pro 1.000 Anfragen
Gesamt: 6,8875 $ pro 1.000 Anfragen

Der Nutzer verwendet die Google Suche, um fundierte Antworten zu generieren. Jeder Eingabe-Prompt ist 500 Zeichen lang und jeder Ausgabe-Prompt 200 Zeichen lang. Der Nutzer hat Gemini 1.5 Flash ausgewählt.

Volumen pro Anfrage Preis pro 1.000 Anfragen
Prompt 500 Zeichen 1.000 Anfragen × 0,000125 $ pro 1.000 Zeichen × 500 Zeichen pro Anfrage = 0,0625$pro 1.000 Anfragen
Ausgabe 200 Zeichen 1.000 Anfragen × 0,000375 $ pro 1.000 Zeichen × 200 Zeichen pro Anfrage = 0,075$pro 1.000 Anfragen
Gegründete Generierung als Fundament für die Google Suche 1 Anfrage 35$pro 1.000 Anfragen
Gesamt: 35,1375 $ pro 1.000 Anfragen

Preise für die Grounding API ansehen

Mit dieser Funktion lässt sich bestimmen, wie begründet sich ein Textabschnitt (der Antwortvorschlag) in einem bestimmten Satz von Referenztexten (Fakten) befindet.

Fundierung prüfen 0,00075 $ pro 1.000 Antwortzeichen

Preise für Document AI-Features

Die vollständigen Preisinformationen für alle Document AI-Funktionen finden Sie auf der Preisseite für Document AI.

In den folgenden Tabellen finden Sie Informationen zu den in Vertex AI Search integrierten und über Vertex AI Search abgerechneten Document AI-Funktionen.

Text digitalisieren

Prozessor 1–5.000.000 Seiten/Monat * 5.000.001+ Seiten/Monat
OCR-Prozessor für Enterprise-Dokumente 1,50 $ pro 1.000 Seiten 0,60 $ pro 1.000 Seiten

Strukturen und Elemente aus Dokumenten extrahieren

Layout-Parser (enthält anfängliche Aufteilung) 10 $ pro 1.000 Seiten

*Die Größe einer Seite hängt vom Dateiformat ab.

  • Bilder (JPEG/JPG, PNG, BMP, HEIF): Jedes Bild = 1 Seite

  • PDF: Jede Seite in der PDF entspricht einer Seite.

  • TIFF: Jedes Bild in der TIFF = 1 Seite

  • Word (DOCX): bis zu 3.000 Zeichen = 1 Seite

  • Excel (XLSX): Jeder Tab = 1 Seite

  • PowerPoint (PPTX): Jede Folie = 1 Seite

  • HTML: Bis zu 3.000 Zeichen = 1 Seite

  • Geparste Dokumente: Bis zu 3.000 Zeichen = 1 Seite

Ranking API-Preise

Die Ranking-API nimmt eine Liste von Dokumenten und bewertet diese Dokumente danach, wie relevant sie für eine Abfrage sind.

Im Vergleich zu Einbettungen, bei denen nur die semantische Ähnlichkeit eines Dokuments und einer Abfrage berücksichtigt wird, kann die Ranking API präzise Bewertungen dafür liefern, wie gut ein Dokument eine bestimmte Anfrage beantwortet.

Die Ranking API kann verwendet werden, um die Qualität der Suchergebnisse zu verbessern, nachdem ein erster Satz von Kandidatendokumenten abgerufen wurde.

Dokumente einstufen

Ranking 1 $ pro 1.000 Abfragen

Eine Anfrage umfasst bis zu 100 Dokumente, wobei ein Nutzer auch mehr als 100 Dokumente pro Anfrage angeben kann. Falls mehr als 100 Dokumente angegeben sind, wird der Preis für jedes Vielfache von 100 Dokumenten um 1 erhöht.
Beispiel:

  • 132 einzuordnende Dokumente = 2 Suchanfragen

  • 200 Dokumente zur Einstufung = 2 Suchanfragen

  • 399 einzuordnende Dokumente = 4 Suchanfragen

  • 401 einzustufende Dokumente = 5 Suchanfragen

Nächste Schritte

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.
Vertrieb kontaktieren