Vertex AI Agent Engine 是 Vertex AI Platform的一部分,也是一组服务,可让开发者在生产环境中部署、管理和扩缩 AI 代理。Agent Engine 负责处理基础设施,使智能体在生产环境中能够自动伸缩,因此您可以专注于创建应用。Vertex AI Agent Engine 提供以下服务,您可以单独使用这些服务,也可以组合使用:
运行时:
- 利用托管式运行时和端到端管理功能部署和扩缩智能体。
- 使用构建时安装脚本自定义代理的容器映像,以添加系统依赖项。
- 使用安全功能,包括 VPC-SC 合规性以及身份验证和 IAM 的配置。
- 访问模型和工具,例如函数调用。
- 部署使用不同 Python 框架和 Agent2Agent 开放协议构建的代理。
- 通过 Google Cloud Trace(支持 OpenTelemetry)、Cloud Monitoring 和 Cloud Logging 了解代理的行为。
质量和评估(预览版):使用集成的 Gen AI Evaluation Service 评估智能体质量,并通过 Gemini 模型训练运行优化智能体。
示例存储区(预览版):存储和动态检索少样本示例,以提升智能体性能。
会话(预览版):Agent Engine 会话可让您存储用户与代理之间的单次互动,为对话上下文提供明确的来源。
记忆库(预览版):借助 Agent Engine 记忆库,您可以存储和检索会话信息,打造个性化代理互动体验。
代码执行(预览版):借助 Agent Engine 代码执行功能,您的代理可以在安全、隔离且受管理的沙盒环境中运行代码。
Vertex AI Agent Engine 是 Vertex AI Agent Builder 的一部分,后者是一套用于发现、构建和部署 AI 代理的功能。
在 Vertex AI Agent Engine 上创建和部署
注意:如需使用 Vertex AI Agent Engine 获得简化的 IDE 相关开发和部署体验,请考虑使用Agent Starter Pack。它提供即用型模板、用于实验的内置界面,并简化了部署、运营、评估、自定义和可观测性。
在 Vertex AI Agent Engine 上构建智能体的工作流如下:
步骤 | 说明 |
---|---|
1. 设置环境 | 设置 Google 项目并安装最新版本的 Vertex AI SDK for Python。 |
2. 开发代理 | 开发可在 Vertex AI Agent Engine 上部署的智能体。 |
3. 部署智能体 | 将智能体部署到 Vertex AI Agent Engine 托管式运行时。 |
4. 使用智能体 | 通过发送 API 请求来查询代理。 |
5. 管理已部署的代理 | 管理和删除已部署到 Vertex AI Agent Engine 的智能体。 |
这些步骤如下图所示:
支持的框架
下表介绍了 Vertex AI Agent Engine 对各种代理框架的支持级别:
支持级别 | 代理框架 |
---|---|
自定义模板:您可以调整自定义模板,以支持从框架部署到 Vertex AI Agent Engine。 | CrewAI、自定义框架 |
Vertex AI SDK 集成:Vertex AI Agent Engine 在 Vertex AI SDK 和文档中按框架提供受管理的模板。 | AG2、LlamaIndex |
全面集成:这些功能已集成,可在框架、Vertex AI Agent Engine 和更广泛的 Google Cloud 生态系统中运行。 | 智能体开发套件 (ADK)、LangChain、LangGraph |
使用Agent Starter Pack在生产环境中部署
Agent Starter Pack是一组可用于生产环境的生成式 AI 智能体模板,专为 Vertex AI Agent Engine 而打造。Agent Starter Pack提供以下内容:
- 预构建的代理模板:ReAct、RAG、多代理和其他模板。
- 互动式平台:测试您的代理并与之互动。
- 自动化基础设施:使用 Terraform 来简化资源管理。
- CI/CD 流水线:利用 Cloud Build 实现的自动化部署工作流。
- 可观测性:内置对 Cloud Trace 和 Cloud Logging 的支持。
如需开始使用,请参阅快速入门。
使用场景
如需通过端到端示例了解 Vertex AI Agent Engine,请参阅以下资源:
企业级安全
Vertex AI Agent Engine 支持多项功能,可帮助您满足企业安全要求、遵守组织的安全政策,并遵循安全最佳实践。支持以下功能:
客户管理的加密密钥 (CMEK):Vertex AI Agent Engine 支持 CMEK,以便您使用自己的加密密钥保护数据,从而获得用于保护 Google Cloud中静态数据的密钥的所有权和完全控制权。如需了解详情,请参阅 Agent Engine CMEK。
VPC Service Controls:Vertex AI Agent Engine 支持 VPC Service Controls,以加强数据安全性并降低数据渗漏风险。配置 VPC Service Controls 后,已部署的代理会保留对 Google API 和服务(例如 BigQuery API、Cloud SQL Admin API 和 Vertex AI API)的安全访问权限,从而确保在您定义的边界内实现无缝运行。至关重要的是,VPC Service Controls 可有效阻止所有公共互联网访问,将数据移动限制在授权的网络边界内,从而显著改善企业安全状况。
数据驻留 (DRZ):Vertex AI Agent Engine 支持数据驻留 (DRZ),以确保所有静态数据都存储在指定区域内。
Private Service Connect 接口:PSC-I 可让代理与用户 VPC 中以私密方式托管的服务进行互动。如需了解详情,请参阅将 Private Service Connect 接口与 Vertex AI Agent Engine 搭配使用。
HIPAA:作为 Vertex AI Platform 的一部分,Vertex AI Agent Engine 支持 HIPAA 工作负载。
支持的区域
Vertex AI Agent Engine 和 Agent Engine 会话在以下区域受支持:
区域 | 位置 | 支持的版本 |
---|---|---|
us-central1 |
艾奥瓦 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
us-east4 |
北弗吉尼亚 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
us-west1 |
俄勒冈 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
europe-west1 |
比利时 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
europe-west2 |
伦敦 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
europe-west3 |
法兰克福 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
europe-west4 |
荷兰 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
europe-southwest1 |
马德里 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
asia-east1 |
台湾 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
asia-northeast1 |
东京 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
asia-south1 |
孟买 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
asia-southeast1 |
新加坡 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
australia-southeast2 |
墨尔本 | v1 支持正式版功能。v1beta1 支持预览版功能。 |
对于 Agent Engine 记忆库(预览版),支持以下区域:
区域 | 位置 | 支持的版本 |
---|---|---|
us-central1 |
艾奥瓦 | 支持 v1beta1 版。 |
us-east4 |
北弗吉尼亚 | 支持 v1beta1 版。 |
us-west1 |
俄勒冈 | 支持 v1beta1 版。 |
europe-west1 |
比利时 | 支持 v1beta1 版。 |
europe-west4 |
荷兰 | 支持 v1beta1 版。 |
europe-southwest1 |
马德里 | 支持 v1beta1 版。 |
对于 Agent Engine 代码执行(预览版),支持以下区域。
区域 | 位置 | 支持的版本 |
---|---|---|
us-central1 |
艾奥瓦 | 支持 v1beta1 版。 |
Quota
以下限制适用于每个区域中给定项目的 Vertex AI Agent Engine:说明 | 限制 |
---|---|
每分钟创建、删除或更新的 Vertex AI Agent Engine 数 | 10 |
每分钟创建、删除或更新的 Vertex AI Agent Engine 会话数 | 100 |
每分钟 Query 或 StreamQuery Vertex AI Agent Engine 数 |
90 |
每分钟向 Vertex AI Agent Engine 会话附加的事件数 | 300 |
Vertex AI Agent Engine 资源数上限 | 100 |
每分钟创建、删除或更新的 Vertex AI Agent Engine 内存资源数 | 100 |
每分钟从 Vertex AI Agent Engine 记忆库中获取、列出或检索的次数 | 300 |
沙盒环境(代码执行)每分钟的执行请求数 | 1000 |
每个区域的沙盒环境(代码执行)实体数 | 1000 |
每分钟的 A2A 代理POST 请求数(例如 sendMessage 和 cancelTask ) |
60 |
每分钟的 A2A 代理 get 请求数(例如 getTask 和 getCard ) |
600 |
每分钟使用 BidiStreamQuery API 的并发实时双向连接数 |
10 |
价格
Agent Engine Runtime 的价格取决于您的代理用于处理请求的计算量(vCPU 小时数)和内存量(GiB 小时数)。部署的代理处于闲置状态时不会产生任何费用。
产品 | SKU ID | 价格 |
---|---|---|
ReasoningEngine vCPU | 8A55-0B95-B7DC | 0.0994 美元/vCPU-Hr |
ReasoningEngine Memory | 0B45-6103-6EC1 | 0.0105 美元/GiB-Hr |
如需了解详情,请参阅价格。
迁移到基于客户端的 SDK
Vertex AI SDK for Python 中的 agent_engines
模块正在重构为基于客户端的设计,主要原因如下:
- 为了与 Google ADK 和 Google Gen AI SDK 在规范类型表示方面保持一致。 这可确保以一致且标准化的方式在不同 SDK 中表示数据类型,从而简化互操作性并减少转换开销。
- 用于在多项目多位置应用中对 Google Cloud 参数进行客户端级范围限定。这样,应用就可以通过为每个客户端实例配置特定的项目和位置设置,来管理与不同 Google Cloud 项目和地理位置的资源之间的互动。
- 为了提高 Vertex AI Agent Engine 服务的发现能力和凝聚力