Auf dieser Seite werden die Preise und die Abrechnung für die Vertex AI RAG Engine beschrieben, die auf den von Ihnen verwendeten Komponenten der Vertex AI RAG Engine basieren, z. B. Modelle, Reranking und Vektorspeicher.
Weitere Informationen finden Sie auf der Seite Übersicht über die Vertex AI RAG Engine.
Preise und Abrechnung
Die Vertex AI RAG Engine ist kostenlos. Wenn Sie jedoch Vertex AI RAG Engine-Komponenten konfigurieren, kann sich dies auf die Abrechnung auswirken.
In dieser Tabelle wird erläutert, wie die Abrechnung erfolgt, wenn Sie die RAG-Komponenten verwenden.
Komponente | Abrechnung bei Vertex AI RAG Engine |
---|---|
Datenaufnahme | Die Vertex AI RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Zum Beispiel lokale Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Datenquellen über die Vertex AI RAG Engine ist kostenlos. Für die Datenübertragung können jedoch Gebühren anfallen. Dazu gehören beispielsweise Kosten für ausgehenden Traffic. |
Datentransformation (Dateianalyse) |
|
Datentransformation (Aufteilen von Dateien in Chunks) | Unterstützt das Chunking mit fester Größe, das kostenlos ist. |
Generierung von Einbettungen | Die Vertex AI RAG Engine orchestriert die Einbettungserstellung mit dem von Ihnen angegebenen Einbettungsmodell. Die mit diesem Modell verbundenen Kosten werden Ihrem Projekt in Rechnung gestellt. Weitere Informationen zu den Preisen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen in Vertex AI. |
Datenindexierung und ‑abruf |
Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektorsuche:
Eine von RAG verwaltete Datenbank hat zwei Zwecke:
Für eine RAG-verwaltete Datenbank wird eine Spanner-Instanz als Backend verwendet. Für jedes Ihrer Projekte stellt die Vertex AI RAG Engine ein kundenspezifisches Google Cloud Projekt bereit und verwaltet RAG-verwaltete Ressourcen, die in der Vertex AI RAG Engine gespeichert sind, sodass Ihre Daten physisch isoliert sind. Wenn Sie die
Wenn für einen RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet wird, wird Ihnen die von RAG verwaltete Spanner-Instanz in Rechnung gestellt. Die Vertex AI-RAG-Engine überträgt Spanner-Kosten aus Ihrem entsprechenden RAG-verwalteten Projekt in Ihr Google Cloud -Projekt, damit Sie die Kosten für die Spanner-Instanz sehen und bezahlen können. Weitere Preisinformationen zu Spanner finden Sie unter Spanner-Preise. |
Reranking für die Vertex AI-RAG-Engine | Die folgenden Ranking-Tools werden nach dem Abrufen unterstützt:
|
Vertex AI-RAG-Engine löschen
In den folgenden Codebeispielen wird veranschaulicht, wie Sie eine Vertex AI RAG Engine für die Google Cloud -Konsole, Python und REST löschen:
Parameter und Codebeispiele für die Version 1 (v1) der API.
Parameter und Codebeispiele für die v1beta1 API
Nächste Schritte
- Informationen zur Verwendung des Vertex AI SDK zum Ausführen von Vertex AI RAG Engine-Aufgaben finden Sie unter RAG-Kurzanleitung für Python.
- Weitere Informationen zur Fundierung finden Sie unter Fundierungsübersicht.
- Weitere Informationen zu den Antworten von RAG finden Sie unter Ausgabe von Abruf und Generierung der Vertex AI RAG Engine.
- Informationen zur RAG-Architektur: