RAG-Infrastruktur für generative KI-Anwendungen in Google Cloud

Last reviewed 2025-09-22 UTC

Im Folgenden finden Sie eine Liste von Referenzarchitekturen für die Bereitstellung einer generativen KI-Anwendung mit Retrieval Augmented Generation (RAG) in Google Cloud.

Referenzarchitektur Beschreibung
RAG-Infrastruktur für generative KI mit Google Agentspace und Vertex AI Eine agentengesteuerte Architektur, die Google Agentspace als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern.
RAG-Infrastruktur für generative KI mit Vertex AI und Vector Search. Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab bietet.
RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL. Eine vollständig verwaltete Datenbankarchitektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL oder AlloyDB for PostgreSQL gespeichert werden.
RAG-Infrastruktur für generative KI mit GKE und Cloud SQL Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen.
GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph Eine fortschrittliche RAG-Architektur, die die Vektorsuche mit Knowledge Graph-Abfragen kombiniert, um vernetzte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI.