Google Cloud 中生成式 AI 应用的 RAG 基础设施

Last reviewed 2025-09-22 UTC

以下是用于在 Google Cloud中部署具有检索增强生成 (RAG) 功能的生成式 AI 应用的参考架构列表。

参考架构 说明
使用 Google Agentspace 和 Vertex AI 的生成式 AI 的 RAG 基础设施 一种由代理驱动的架构,使用 Google Agentspace 作为统一平台来编排端到端 RAG 数据流,以满足需要实时数据可用性和丰富上下文搜索的企业应用的需求。
使用 Vertex AI 和 Vector Search 的生成式 AI 的 RAG 基础设施 一种全代管式无服务器架构,可为大规模应用提供经过优化的高性能向量搜索。
使用 Vertex AI 和 AlloyDB for PostgreSQL 的生成式 AI 的 RAG 基础设施 一种全代管式数据库架构,可将向量嵌入与您的运营数据一起存储在全代管式数据库(例如 Cloud SQL 或 AlloyDB for PostgreSQL)中。
使用 GKE 和 Cloud SQL 的生成式 AI 的 RAG 基础设施 一种灵活的基于容器的架构,可提供最大程度的控制,以便使用 Ray、Hugging Face 和 LangChain 等开源工具构建自定义应用。
使用 Vertex AI 和 Spanner Graph 为生成式 AI 构建 GraphRAG 基础设施 一种高级 RAG 架构,可将向量搜索与知识图谱查询相结合,以检索相互关联的上下文数据,从而生成更详细且相关的生成式 AI 回答。