Vertex AI Agent Engine 是一組服務,可讓開發人員在正式環境中部署、管理及調度 AI 代理。Agent Engine 會處理基礎架構,以便在正式環境中調度代理,讓您專心打造應用程式。Vertex AI Agent Engine 提供下列服務,可單獨或搭配使用:
執行階段:
- 部署及擴充代理程式,並使用代管執行階段和端對端管理功能。
- 使用系統依附元件的建構時間安裝指令碼,自訂代理程式的容器映像檔。
- 使用安全防護功能,包括 VPC-SC 法規遵循和驗證與 IAM 設定。
- 存取模型和工具,例如函式呼叫。
- 部署使用不同 Python 架構建構的代理程式:
- 透過 Google Cloud Trace (支援 OpenTelemetry)、Cloud Monitoring 和 Cloud Logging,瞭解代理程式的行為。
品質和評估 (搶先版):使用整合式 Gen AI Evaluation Service 評估代理程式品質,並透過 Gemini 模型訓練執行作業,最佳化代理程式。
樣本儲存庫 (搶先版):儲存及動態擷取少量樣本,提升代理程式成效。
工作階段 (搶先版):Agent Engine 工作階段可儲存使用者與代理之間的個別互動,提供對話脈絡的明確來源。
記憶庫 (搶先版):Agent Engine 記憶庫可讓您儲存及擷取工作階段資訊,以便個人化代理互動。
Vertex AI Agent Engine 是 Vertex AI Agent Builder 的一部分,這組功能可用於探索、建構及部署 AI 代理。
在 Vertex AI Agent Engine 中建立及部署
注意:如要透過 IDE 簡化 Vertex AI Agent Engine 的開發和部署體驗,請考慮使用代理程式入門套件。這項服務提供即時可用的範本、內建的實驗 UI,並簡化部署、作業、評估、自訂和可觀測性。
在 Vertex AI Agent Engine 上建構代理的流程如下:
步驟 | 說明 |
---|---|
1. 設定環境 | 設定 Google 專案,並安裝最新版 Vertex AI SDK for Python。 |
2. 開發代理程式 | 開發可部署至 Vertex AI Agent Engine 的代理程式。 |
3. 部署代理程式 | 在 Vertex AI Agent Engine 受管理執行階段部署代理程式。 |
4. 使用代理程式 | 傳送 API 要求來查詢代理程式。 |
5. 管理已部署的代理程式 | 管理及刪除已部署至 Vertex AI Agent Engine 的代理程式。 |
下圖說明這些步驟:
支援的架構
下表說明 Vertex AI Agent Engine 對各種代理程式架構的支援程度:
支援級別 | 代理程式架構 |
---|---|
自訂範本:您可以調整自訂範本,支援從架構部署至 Vertex AI Agent Engine。 | CrewAI、自訂架構 |
整合 Vertex AI SDK:Vertex AI Agent Engine 會在 Vertex AI SDK 和說明文件中,提供每個架構的受管理範本。 | AG2、LlamaIndex |
完整整合:這些功能已整合至架構、Vertex AI Agent Engine 和更廣泛的 Google Cloud 生態系統。 | 代理程式開發套件 (ADK)、LangChain、LangGraph |
使用 Agent Starter Pack 部署至正式環境
Agent Starter Pack 是一系列適用於正式環境的生成式 AI 代理範本,專為 Vertex AI Agent Engine 而建。Agent Starter Pack 提供下列項目:
- 預先建構的代理範本:ReAct、RAG、多代理和其他範本。
- 互動式遊樂場:測試及與代理互動。
- 自動化基礎架構:使用 Terraform 簡化資源管理。
- 持續整合/持續部署管道:運用 Cloud Build 的自動部署工作流程。
- 可觀測性:內建支援 Cloud Trace 和 Cloud Logging。
如要開始使用,請參閱快速入門。
用途
如要透過端對端範例瞭解 Vertex AI Agent Engine,請參閱下列資源:
企業安全性
Vertex AI Agent Engine 支援 VPC Service Controls,可強化資料安全防護,並降低資料遭竊風險。設定 VPC Service Controls 後,已部署的代理程式會保留 Google API 和服務 (例如 BigQuery API、Cloud SQL Admin API 和 Vertex AI API) 的安全存取權,確保在您定義的範圍內順暢運作。VPC Service Controls 的重要功能是有效封鎖所有公用網路存取權,將資料移動限制在授權網路邊界內,大幅提升企業安全狀態。
支援的地區
Vertex AI Agent Engine 支援下列區域:
區域 | 位置 | 支援的版本 |
---|---|---|
us-central1 |
愛荷華州 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
us-east4 |
北維吉尼亞州 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
us-west1 |
奧勒岡州 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
europe-west1 |
比利時 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
europe-west2 |
倫敦 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
europe-west3 |
法蘭克福 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
europe-west4 |
荷蘭 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
europe-southwest1 |
馬德里 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
asia-east1 |
台灣 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
asia-northeast1 |
東京 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
asia-south1 |
孟買 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
asia-southeast1 |
新加坡 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
australia-southeast2 |
墨爾本 | Google Analytics 功能支援 v1 。v1beta1 支援預先發布版功能。 |
Agent Engine Memory Bank (預覽版) 支援下列區域:
區域 | 位置 | 支援的版本 |
---|---|---|
us-central1 |
愛荷華州 | 支援 v1beta1 版本。 |
us-west1 |
奧勒岡州 | 支援 v1beta1 版本。 |
europe-west1 |
比利時 | 支援 v1beta1 版本。 |
europe-west4 |
荷蘭 | 支援 v1beta1 版本。 |
europe-southwest1 |
馬德里 | 支援 v1beta1 版本。 |
配額
下列限制適用於各區域中特定專案的 Vertex AI Agent Engine:說明 | 限制 |
---|---|
每分鐘建立、刪除或更新 Vertex AI Agent Engine | 10 |
每分鐘建立、刪除或更新 Vertex AI Agent Engine 工作階段 | 100 |
Query 或 StreamQuery Vertex AI Agent Engine 每分鐘 |
60 |
每分鐘將事件附加至 Vertex AI Agent Engine 工作階段 | 100 |
Vertex AI Agent Engine 資源數量上限 | 100 |
每分鐘建立、刪除或更新 Vertex AI Agent Engine 記憶體資源 | 100 |
每分鐘從 Vertex AI Agent Engine Memory Bank 取得、列出或擷取資料 | 300 |
定價
價格取決於部署至 Vertex AI Agent Engine 受管理執行階段的代理程式所用運算 (vCPU 時數) 和記憶體 (GiB 時數) 資源。
產品 | SKU ID | 價格 |
---|---|---|
ReasoningEngine vCPU | 8A55-0B95-B7DC | $0.0994 美元/vCPU 時數 |
ReasoningEngine Memory | 0B45-6103-6EC1 | $0.0105 美元/GiB 時數 |
詳情請參閱定價。