自 2025 年 4 月 29 日起，之前未使用过 Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型的项目（包括新项目）都将无法使用这些模型。如需了解详情，请参阅模型版本和生命周期。

Vertex AI Agent Engine 概览

Vertex AI Agent Engine 是 Vertex AI Platform的一部分，也是一组服务，可让开发者在生产环境中部署、管理和扩缩 AI 代理。Agent Engine 负责处理基础设施，使智能体在生产环境中能够自动伸缩，因此您可以专注于创建应用。Vertex AI Agent Engine 提供以下服务，您可以单独使用这些服务，也可以组合使用：

运行时：
- 利用托管式运行时和端到端管理功能部署和扩缩智能体。
- 使用构建时安装脚本自定义代理的容器映像，以添加系统依赖项。
- 使用安全功能，包括 VPC-SC 合规性以及身份验证和 IAM 的配置。
- 访问模型和工具，例如函数调用。
- 部署使用不同 Python 框架和 Agent2Agent 开放协议构建的代理。
- 通过 Google Cloud Trace（支持 OpenTelemetry）、Cloud Monitoring 和 Cloud Logging 了解代理的行为。
质量和评估（预览版）：使用集成的 Gen AI Evaluation Service 评估智能体质量，并通过 Gemini 模型训练运行优化智能体。
示例存储区（预览版）：存储和动态检索少样本示例，以提升智能体性能。
会话（预览版）：Agent Engine 会话可让您存储用户与代理之间的单次互动，为对话上下文提供明确的来源。
记忆库（预览版）：借助 Agent Engine 记忆库，您可以存储和检索会话信息，打造个性化代理互动体验。
代码执行（预览版）：借助 Agent Engine 代码执行功能，您的代理可以在安全、隔离且受管理的沙盒环境中运行代码。

Vertex AI Agent Engine 概念概览

Vertex AI Agent Engine 是 Vertex AI Agent Builder 的一部分，后者是一套用于发现、构建和部署 AI 代理的功能。

在 Vertex AI Agent Engine 上创建和部署

注意：如需使用 Vertex AI Agent Engine 获得简化的 IDE 相关开发和部署体验，请考虑使用Agent Starter Pack。它提供即用型模板、用于实验的内置界面，并简化了部署、运营、评估、自定义和可观测性。

在 Vertex AI Agent Engine 上构建智能体的工作流如下：

步骤	说明
1. 设置环境	设置 Google 项目并安装最新版本的 Vertex AI SDK for Python。
2. 开发代理	开发可在 Vertex AI Agent Engine 上部署的智能体。
3. 部署智能体	将智能体部署到 Vertex AI Agent Engine 托管式运行时。
4. 使用智能体	通过发送 API 请求来查询代理。
5. 管理已部署的代理	管理和删除已部署到 Vertex AI Agent Engine 的智能体。

这些步骤如下图所示：

创建和部署代理

支持的框架

下表介绍了 Vertex AI Agent Engine 对各种代理框架的支持级别：

支持级别	代理框架
自定义模板：您可以调整自定义模板，以支持从框架部署到 Vertex AI Agent Engine。	CrewAI、自定义框架
Vertex AI SDK 集成：Vertex AI Agent Engine 在 Vertex AI SDK 和文档中按框架提供受管理的模板。	AG2、LlamaIndex
全面集成：这些功能已集成，可在框架、Vertex AI Agent Engine 和更广泛的 Google Cloud 生态系统中运行。	智能体开发套件 (ADK)、LangChain、LangGraph

使用Agent Starter Pack在生产环境中部署

Agent Starter Pack是一组可用于生产环境的生成式 AI 智能体模板，专为 Vertex AI Agent Engine 而打造。Agent Starter Pack提供以下内容：

预构建的代理模板：ReAct、RAG、多代理和其他模板。
互动式平台：测试您的代理并与之互动。
自动化基础设施：使用 Terraform 来简化资源管理。
CI/CD 流水线：利用 Cloud Build 实现的自动化部署工作流。
可观测性：内置对 Cloud Trace 和 Cloud Logging 的支持。

如需开始使用，请参阅快速入门。

使用场景

如需通过端到端示例了解 Vertex AI Agent Engine，请参阅以下资源：

使用场景	说明	链接
通过连接到公共 API 来构建代理	货币换算。创建一个连接到货币兑换应用的函数，使模型能够为诸如“今天欧元兑美元的汇率是多少？”之类的查询提供准确的答案。	Vertex AI SDK for Python 笔记本 - 使用 Vertex AI Agent Engine 构建和部署代理简介
通过连接到公共 API 来构建代理	设计社区太阳能项目。确定潜在位置，查询相关政府办公室和供应商，并查看区域和建筑物的卫星图像和太阳能板发电潜力，以找到安装太阳能板的最佳位置。	Vertex AI SDK for Python 笔记本 - 使用 Vertex AI Agent Engine 构建和部署 Google 地图 API 代理
通过连接到数据库来构建代理	与 AlloyDB 和 Cloud SQL for PostgreSQL 集成。	博文 - 宣布在 Vertex AI 上为 AlloyDB 和 Cloud SQL for PostgreSQL 提供 LangChain Vertex AI SDK for Python 笔记本 - 将 RAG 应用与 Cloud SQL for PostgreSQL 部署到 Vertex AI Agent Engine Vertex AI SDK for Python 笔记本 - 将 RAG 应用与 AlloyDB for PostgreSQL 部署到 Vertex AI Agent Engine
	使用可访问数据库中数据的工具构建智能体。	Vertex AI SDK for Python 笔记本 - 使用 Vertex AI Agent Engine 和 MCP Toolbox for Databases 部署代理
	使用自然语言查询和理解结构化数据存储区。	Vertex AI SDK for Python 笔记本 - 在 Vertex AI Search 上使用 Vertex AI Agent Engine 和 RAG 构建对话式搜索代理
	使用自然语言查询和理解图表数据库	博文 - 将 Vertex AI Agent Engine 与 LangChain 和 Neo4j 搭配使用的生成式 AI GraphRAG 和 AI 代理
	使用自然语言查询和理解矢量存储区	博文 - 使用 MongoDB Atlas 和 Vertex AI Agent Engine 简化生成式 AI RAG
使用智能体开发套件构建智能体	使用智能体开发套件构建和部署智能体。	智能体开发套件 - 部署到 Vertex AI Agent Engine
使用智能体开发套件构建智能体	在 Vertex AI 快速模式下，无需付费即可使用 Vertex AI Agent Engine 会话和记忆库管理上下文。	智能体开发套件 - Vertex AI 快速模式下的 Vertex AI Agent Engine 会话和记忆库。
使用 OSS 框架构建智能体	使用 OneTwo 开源框架构建和部署代理。	博文 - OneTwo 和 Vertex AI Agent Engine：探索 Google Cloud上的高级 AI 代理开发
使用 OSS 框架构建智能体	使用 LangGraph 开源框架构建和部署代理。	Vertex AI SDK for Python 笔记本 - 使用 Vertex AI Agent Engine 构建和部署 LangGraph 应用
调试和优化代理	使用 OpenTelemetry 和 Cloud Trace 构建和跟踪代理。	Vertex AI SDK for Python 笔记本 - 调试和优化代理：Vertex AI Agent Engine 中的跟踪指南
使用 A2A protocol构建多智能体系统（预览版）	构建可互操作的智能体，使其能够与其他智能体进行通信和协作，而无需考虑其框架。	如需了解详情，请参阅 A2A protocol文档。

企业级安全

Vertex AI Agent Engine 支持多项功能，可帮助您满足企业安全要求、遵守组织的安全政策，并遵循安全最佳实践。支持以下功能：

客户管理的加密密钥 (CMEK)：Vertex AI Agent Engine 支持 CMEK，以便您使用自己的加密密钥保护数据，从而获得用于保护 Google Cloud中静态数据的密钥的所有权和完全控制权。如需了解详情，请参阅 Agent Engine CMEK。
VPC Service Controls：Vertex AI Agent Engine 支持 VPC Service Controls，以加强数据安全性并降低数据渗漏风险。配置 VPC Service Controls 后，已部署的代理会保留对 Google API 和服务（例如 BigQuery API、Cloud SQL Admin API 和 Vertex AI API）的安全访问权限，从而确保在您定义的边界内实现无缝运行。至关重要的是，VPC Service Controls 可有效阻止所有公共互联网访问，将数据移动限制在授权的网络边界内，从而显著改善企业安全状况。

注意：如果您在 VPC-SC 环境中使用 Vertex AI Agent Engine，则必须在边界中创建入站流量规则，以允许从Reasoning Engine Service Agent (service-PROJECT_NUMBER@gcp-sa-aiplatform-re.iam.gserviceaccount.com) 到 storage.googleapis.com 服务和 artifactregistry.googleapis.com 服务的入站流量。
数据驻留 (DRZ)：Vertex AI Agent Engine 支持数据驻留 (DRZ)，以确保所有静态数据都存储在指定区域内。
Private Service Connect 接口：PSC-I 可让代理与用户 VPC 中以私密方式托管的服务进行互动。如需了解详情，请参阅将 Private Service Connect 接口与 Vertex AI Agent Engine 搭配使用。
HIPAA：作为 Vertex AI Platform 的一部分，Vertex AI Agent Engine 支持 HIPAA 工作负载。

支持的区域

Vertex AI Agent Engine 和 Agent Engine 会话在以下区域受支持：

区域	位置	支持的版本
`us-central1`	艾奥瓦	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`us-east4`	北弗吉尼亚	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`us-west1`	俄勒冈	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`europe-west1`	比利时	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`europe-west2`	伦敦	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`europe-west3`	法兰克福	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`europe-west4`	荷兰	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`europe-southwest1`	马德里	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`asia-east1`	台湾	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`asia-northeast1`	东京	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`asia-south1`	孟买	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`asia-southeast1`	新加坡	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。
`australia-southeast2`	墨尔本	`v1` 支持正式版功能。`v1beta1` 支持预览版功能。

对于 Agent Engine 记忆库（预览版），支持以下区域：

区域	位置	支持的版本
`us-central1`	艾奥瓦	支持 `v1beta1` 版。
`us-east4`	北弗吉尼亚	支持 `v1beta1` 版。
`us-west1`	俄勒冈	支持 `v1beta1` 版。
`europe-west1`	比利时	支持 `v1beta1` 版。
`europe-west4`	荷兰	支持 `v1beta1` 版。
`europe-southwest1`	马德里	支持 `v1beta1` 版。

对于 Agent Engine 代码执行（预览版），支持以下区域。

区域	位置	支持的版本
`us-central1`	艾奥瓦	支持 `v1beta1` 版。

Quota

以下限制适用于每个区域中给定项目的 Vertex AI Agent Engine：

说明	限制
每分钟创建、删除或更新的 Vertex AI Agent Engine 数	10
每分钟创建、删除或更新的 Vertex AI Agent Engine 会话数	100
每分钟 `Query` 或 `StreamQuery` Vertex AI Agent Engine 数	90
每分钟向 Vertex AI Agent Engine 会话附加的事件数	300
Vertex AI Agent Engine 资源数上限	100
每分钟创建、删除或更新的 Vertex AI Agent Engine 内存资源数	100
每分钟从 Vertex AI Agent Engine 记忆库中获取、列出或检索的次数	300
沙盒环境（代码执行）每分钟的执行请求数	1000
每个区域的沙盒环境（代码执行）实体数	1000
每分钟的 A2A 代理POST 请求数（例如 `sendMessage` 和 `cancelTask`）	60
每分钟的 A2A 代理 get 请求数（例如 `getTask` 和 `getCard`）	600
每分钟使用 `BidiStreamQuery` API 的并发实时双向连接数	10

价格

Agent Engine Runtime 的价格取决于您的代理用于处理请求的计算量（vCPU 小时数）和内存量（GiB 小时数）。部署的代理处于闲置状态时不会产生任何费用。

产品	SKU ID	价格
ReasoningEngine vCPU	8A55-0B95-B7DC	0.0994 美元/vCPU-Hr
ReasoningEngine Memory	0B45-6103-6EC1	0.0105 美元/GiB-Hr

如需了解详情，请参阅价格。

迁移到基于客户端的 SDK

Vertex AI SDK for Python 中的 agent_engines 模块正在重构为基于客户端的设计，主要原因如下：

为了与 Google ADK 和 Google Gen AI SDK 在规范类型表示方面保持一致。这可确保以一致且标准化的方式在不同 SDK 中表示数据类型，从而简化互操作性并减少转换开销。
用于在多项目多位置应用中对 Google Cloud 参数进行客户端级范围限定。这样，应用就可以通过为每个客户端实例配置特定的项目和位置设置，来管理与不同 Google Cloud 项目和地理位置的资源之间的互动。
为了提高 Vertex AI Agent Engine 服务的发现能力和凝聚力

后续步骤

设置环境。
获取支持。