此页面由 Cloud Translation API 翻译。

Google Cloud 中生成式 AI 应用的 RAG 基础设施

Last reviewed 2025-09-22 UTC

以下是用于在 Google Cloud中部署具有检索增强生成 (RAG) 功能的生成式 AI 应用的参考架构列表。

参考架构	说明
使用 Google Agentspace 和 Vertex AI 的生成式 AI 的 RAG 基础设施	一种由代理驱动的架构，使用 Google Agentspace 作为统一平台来编排端到端 RAG 数据流，以满足需要实时数据可用性和丰富上下文搜索的企业应用的需求。
使用 Vertex AI 和 Vector Search 的生成式 AI 的 RAG 基础设施。	一种全代管式无服务器架构，可为大规模应用提供经过优化的高性能向量搜索。
使用 Vertex AI 和 AlloyDB for PostgreSQL 的生成式 AI 的 RAG 基础设施。	一种全代管式数据库架构，可将向量嵌入与您的运营数据一起存储在全代管式数据库（例如 Cloud SQL 或 AlloyDB for PostgreSQL）中。
使用 GKE 和 Cloud SQL 的生成式 AI 的 RAG 基础设施	一种灵活的基于容器的架构，可提供最大程度的控制，以便使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义应用。
使用 Vertex AI 和 Spanner Graph 为生成式 AI 构建 GraphRAG 基础设施	一种高级 RAG 架构，可将向量搜索与知识图谱查询相结合，以检索相互关联的上下文数据，从而生成更详细且相关的生成式 AI 回答。