Auf dieser Seite wird die Einbindung von Vertex AI Search in die Vertex AI RAG Engine beschrieben.
Vertex AI Search bietet eine Lösung zum Abrufen und Verwalten von Daten in Ihren Vertex AI-RAG-Anwendungen. Wenn Sie Vertex AI Search als Abruf-Backend verwenden, können Sie Leistung, Skalierbarkeit und Integrationsfreundlichkeit verbessern.
Erhöhte Leistung und Skalierbarkeit: Die Vertex AI Search ist für die Verarbeitung großer Datenmengen mit außergewöhnlich niedriger Latenz konzipiert. Dies führt zu kürzeren Reaktionszeiten und einer verbesserten Leistung Ihrer RAG-Anwendungen, insbesondere bei komplexen oder umfangreichen Wissensbasen.
Einfachere Datenverwaltung: Sie können Daten aus verschiedenen Quellen wie Websites, BigQuery-Datasets und Cloud Storage-Buckets importieren, um den Dateneinnahmeprozess zu optimieren.
Nahtlose Integration: Vertex AI bietet eine integrierte Integration mit Vertex AI Search, mit der Sie Vertex AI Search als Korpus-Backend für Ihre RAG-Anwendung auswählen können. Das vereinfacht den Integrationsprozess und trägt zu einer optimalen Kompatibilität zwischen den Komponenten bei.
Verbesserte LLM-Ausgabequalität: Mit den Abruffunktionen von Vertex AI Search können Sie dafür sorgen, dass Ihre RAG-Anwendung die relevantesten Informationen aus Ihrem Korpus abruft. Das führt zu präziseren und informativeren LLM-generierten Ergebnissen.
Vertex AI Search
Vertex AI Search vereint die Leistungsfähigkeit von umfassenden Informationsabrufen, Natural Language Processing und den neuesten Funktionen der Verarbeitung von Large Language Models (LLMs), um Nutzerabsichten zu verstehen und die relevantesten Ergebnisse für die Nutzer zurückzugeben.
Mit Vertex AI Search können Sie eine Suchanwendung in Google-Qualität mit von Ihnen verwalteten Daten erstellen.
Vertex AI Search konfigurieren
So richten Sie eine Vertex AI Search ein:
Vertex AI Search als Abruf-Backend für die Vertex AI RAG Engine verwenden
Nachdem Vertex AI Search eingerichtet ist, gehen Sie so vor, um es als Abruf-Backend für die RAG-Anwendung festzulegen:
Vertex AI Search als Abruf-Backend festlegen, um einen RAG-Korpus zu erstellen
In diesen Codebeispielen wird gezeigt, wie Sie Vertex AI Search als Abruf-Backend für einen RAG-Korpus konfigurieren.
REST
So erstellen Sie über die Befehlszeile einen RAG-Corpus:
RAG-Korpus erstellen
Ersetzen Sie die folgenden Variablen im Codebeispiel:
- PROJECT_ID: Die ID Ihres Google Cloud Projekts.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll.
- DISPLAY_NAME: Der Anzeigename des RAG-Corpus, das Sie erstellen möchten.
- ENGINE_NAME: Der vollständige Ressourcenname der Vertex AI Search-Suchmaschine oder des Vertex AI Search-Datenspeichers.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragCorpora" \ -d '{ "display_name" : "DISPLAY_NAME", "vertex_ai_search_config" : { "serving_config": "ENGINE_NAME/servingConfigs/default_search" } }'
Fortschritt im Blick behalten
Ersetzen Sie die folgenden Variablen im Codebeispiel:
- PROJECT_ID: Die ID Ihres Google Cloud Projekts.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll.
- OPERATION_ID: Die ID des Vorgangs zum Erstellen des RAG-Korpus.
curl -X GET \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID"
Python
Bevor Sie dieses Beispiel anwenden, folgen Sie den Python-Einrichtungsschritten in der Vertex AI-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI Python API.
Richten Sie zur Authentifizierung bei Vertex AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Kontexte mit der RAG API abrufen
Nach der Erstellung des RAG-Korpus können relevante Kontexte über die RetrieveContexts
API aus Vertex AI Search abgerufen werden.
REST
Dieses Codebeispiel zeigt, wie Kontexte mithilfe von REST abgerufen werden.
Ersetzen Sie die folgenden Variablen im Codebeispiel:
- PROJECT_ID: Die ID Ihres Google Cloud Projekts.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll.
- RAG_CORPUS_RESOURCE: Der Name der RAG-Korpusressource.
Format:
projects/{project}/locations/{location}/ragCorpora/{rag_corpus}.
- TEXT: Der Abfragetext, um relevante Kontexte abzurufen.
curl -X POST \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts" \
-d '{
"vertex_rag_store": {
"rag_resources": {
"rag_corpus": "RAG_CORPUS_RESOURCE"
}
},
"query": {
"text": "TEXT"
}
}'
Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Python API.
Inhalte mit der Vertex AI Gemini API generieren
REST
Wenn Sie Inhalte mit Gemini-Modellen generieren möchten, rufen Sie die Vertex AI GenerateContent
API auf. Wenn Sie RAG_CORPUS_RESOURCE
in der Anfrage angeben, werden automatisch Daten aus Vertex AI Search abgerufen.
Ersetzen Sie die folgenden Variablen im Beispielcode:
- PROJECT_ID: Die ID Ihres Google Cloud Projekts.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll.
- MODEL_ID: LLM-Modell für die Inhaltsgenerierung. Beispiel:
gemini-1.5-flash-002
. - GENERATION_METHOD: LLM-Methode für die Inhaltsgenerierung.
Beispiel:
generateContent
,streamGenerateContent
. - INPUT_PROMPT: Der Text, der zur Inhaltsgenerierung an das LLM gesendet wird. Verwenden Sie einen Prompt, der für die Dokumente in Vertex AI Search relevant ist.
- RAG_CORPUS_RESOURCE: Der Name der RAG-Korpusressource. Format:
projects/{project}/locations/{location}/ragCorpora/{rag_corpus}
. SIMILARITY_TOP_K: Optional: Die Anzahl der Top-Kontexte, die abgerufen werden sollen.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD" \ -d '{ "contents": { "role": "user", "parts": { "text": "INPUT_PROMPT" } }, "tools": { "retrieval": { "disable_attribution": false, "vertex_rag_store": { "rag_resources": { "rag_corpus": "RAG_CORPUS_RESOURCE" }, "similarity_top_k": SIMILARITY_TOP_K } } } }'
Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Python API.