本頁面由 Cloud Translation API 翻譯而成。

在 Cloud Run 上代管 AI 應用程式和代理程式

本頁面將重點介紹幾個使用 Cloud Run 做為下列 AI 用途主機平台的應用情境：

AI 應用程式
AI 代理

在 Cloud Run 託管 AI 應用程式

AI 應用程式會使用 AI 模型運作或執行特定工作。舉例來說，AI 應用程式可以使用 AI 模型摘要文件，或是透過聊天介面使用向量資料庫擷取更多內容。

Cloud Run 是應用程式代管基礎架構之一，可為 AI 應用程式工作負載提供全代管環境。 Cloud Run 可整合 Gemini API、Vertex AI 端點等 AI 模型，或已啟用 GPU 的 Cloud Run 服務所代管的模型。 Cloud Run 也與 PostgreSQL 適用的 Cloud SQL 和 PostgreSQL 適用的 AlloyDB 整合，這兩個資料庫都提供 pgvector 擴充功能，可供檢索增強生成 (RAG) 使用。

在 Cloud Run 託管 AI 代理

AI 代理會結合進階 AI 模型的智慧功能和各種工具，代表使用者執行各種操作，但掌控權仍在使用者手中。

您可以將 AI 代理程式實作為 Cloud Run 服務，透過多輪要求/回應互動，協調處理一組非同步工作，並向使用者提供資訊。

Cloud Run 上的 AI 代理架構

在 Cloud Run 上部署的典型 AI 代理架構可能涉及 Google Cloud 內外 Google Cloud的數個元件：

Cloud Run 上的 AI 代理架構

服務和協調：Cloud Run 服務可做為可擴充的 API 端點，並透過自動、隨選的執行個體快速調度，處理多位並行使用者。這項服務會執行核心代理程式邏輯，通常使用 LangGraph 或 Agent Development Kit (ADK) 等 AI 協調架構。這個層會協調對其他元件的呼叫。Cloud Run 支援使用 WebSockets 將串流 HTTP 回應傳回給使用者。Cloud Run 內建的服務身分提供安全且自動的憑證，可呼叫 Google Cloud API，不必管理 API 金鑰。
AI 模型：自動調度管理層會呼叫模型，提供推理能力。可能的形式包括：
- Gemini API
- 部署在 Vertex AI 端點的自訂模型或其他基礎模型
- 您自己的微調模型，可透過獨立的啟用 GPU 的 Cloud Run 服務提供服務
記憶：代理通常需要記憶功能來保留脈絡，並從過往互動中學習。
- 短期記憶可透過將 Cloud Run 連線至 Memorystore for Redis 實作。
- 如要實作長期記憶，儲存對話記錄或記住使用者偏好設定，可以將 Cloud Run 連線至 Firestore，這是一種可擴充的無伺服器 NoSQL 資料庫。
資料庫和擷取：適用於檢索增強生成 (RAG) 或擷取結構化資料：
- 將 Cloud Run 連線至 pgvector 擴充功能，即可透過 PostgreSQL 適用的 Cloud SQL 或 PostgreSQL 適用的 AlloyDB 等向量資料庫，查詢特定實體資訊或對嵌入內容執行相似度搜尋。
工具：協調器會使用工具執行模型不適合執行的特定工作，或與外部服務、API 或網站互動。這些實用資源包括：
- 基本公用程式：精確的數學計算、時間轉換或其他類似公用程式，可在協調 Cloud Run 服務中執行。
- 呼叫 API：呼叫其他內部或第三方 API (讀取或寫入存取權)。
- 生成圖片或圖表：使用圖片生成模型或執行圖表程式庫，快速有效地建立視覺內容。
- 瀏覽器和 OS 自動化：在容器執行個體中執行無頭或完整圖形作業系統，讓代理程式瀏覽網路、從網站擷取資訊，或使用點擊和鍵盤輸入執行動作。Cloud Run 服務會傳回螢幕的像素。使用 Puppeteer 等程式庫控制瀏覽器。
- 程式碼執行：Cloud Run 提供多層沙箱的安全性環境，且可設定為程式碼執行服務，並具備最少或沒有 IAM 權限。Cloud Run 工作可用於非同步執行程式碼，而並行數為 1 的 Cloud Run 服務則可用於同步執行作業。

後續步驟

觀看「在 Cloud Run 建構 AI 代理」。
請嘗試程式碼研究室，瞭解如何建構 LangChain 應用程式並部署至 Cloud Run。
瞭解如何將 Agent Development Kit (ADK) 部署至 Cloud Run。
請嘗試程式碼研究室，瞭解如何搭配 ADK 代理程式，在 Cloud Run 上使用 MCP 伺服器。
如要將 ADK 代理程式部署到含 GPU 的 Cloud Run，請嘗試程式碼研究室。
在 Agent Development Kit (ADK) 範例中，尋找可直接使用的代理範例。
在 Cloud Run 託管 Model Context Protocol (MCP) 伺服器。