Last reviewed 2025-09-22 UTC
以下列出參考架構,協助您在 Google Cloud中部署採用檢索增強生成 (RAG) 技術的生成式 AI 應用程式。
參考架構 | 說明 |
---|---|
使用 Google Agentspace 和 Vertex AI 建構生成式 AI 的 RAG 基礎架構 | 以代理程式為主的架構,使用 Google Agentspace 做為統一平台,協調端對端 RAG 資料流,適用於需要即時資料可用性和豐富情境搜尋的企業應用程式。 |
使用 Vertex AI 和 Vector Search 建構生成式 AI 的 RAG 基礎架構。 | 全代管無伺服器架構,可為大規模應用程式提供最佳化的高效能向量搜尋功能。 |
使用 Vertex AI 和 AlloyDB for PostgreSQL 建構生成式 AI 的 RAG 基礎架構。 | 全代管資料庫架構,可將向量嵌入內容與作業資料一併儲存在全代管資料庫中,例如 Cloud SQL 或 PostgreSQL 適用的 AlloyDB。 |
使用 GKE 和 Cloud SQL 建構生成式 AI 的 RAG 基礎架構 | 彈性的容器式架構,可提供最大程度的控制權,讓您使用 Ray、Hugging Face 和 LangChain 等開放原始碼工具建構自訂應用程式。 |
使用 Vertex AI 和 Spanner Graph 建構生成式 AI 的 GraphRAG 基礎架構 | 進階 RAG 架構結合向量搜尋和知識圖譜查詢,可擷取相互連結的脈絡資料,生成更詳細且相關的生成式 AI 回覆。 |