Last reviewed 2025-09-22 UTC
Im Folgenden finden Sie eine Liste von Referenzarchitekturen für die Bereitstellung einer generativen KI-Anwendung mit Retrieval Augmented Generation (RAG) in Google Cloud.
Referenzarchitektur | Beschreibung |
---|---|
RAG-Infrastruktur für generative KI mit Google Agentspace und Vertex AI | Eine agentengesteuerte Architektur, die Google Agentspace als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern. |
RAG-Infrastruktur für generative KI mit Vertex AI und Vector Search. | Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab bietet. |
RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL. | Eine vollständig verwaltete Datenbankarchitektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL oder AlloyDB for PostgreSQL gespeichert werden. |
RAG-Infrastruktur für generative KI mit GKE und Cloud SQL | Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen. |
GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph | Eine fortschrittliche RAG-Architektur, die die Vektorsuche mit Knowledge Graph-Abfragen kombiniert, um vernetzte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI. |