Vertex AI Agent Engine, que forma parte de la plataforma de Vertex AI, es un conjunto de servicios que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Engine administra la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios que puedes usar de forma individual o combinada:
Tiempo de ejecución:
- Implementa y escala agentes con un entorno de ejecución administrado y capacidades de administración de extremo a extremo.
- Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
- Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la IAM.
- Accede a modelos y herramientas, como las llamadas a funciones.
- Implementa agentes creados con diferentes frameworks de Python y el protocolo abierto Agent2Agent.
- Comprender el comportamiento de los agentes con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging
Calidad y evaluación (versión preliminar): Evalúa la calidad del agente con el servicio de evaluación de IA generativa integrado y optimiza los agentes con ejecuciones de entrenamiento de modelos de Gemini.
Example Store (versión preliminar): Almacena y recupera dinámicamente ejemplos de pocos disparos para mejorar el rendimiento del agente.
Sesiones (versión preliminar): Las sesiones de Agent Engine te permiten almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
Memory Bank (versión preliminar): Memory Bank de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones del agente.
Ejecución de código (versión preliminar): La Ejecución de código de Agent Engine permite que tu agente ejecute código en un entorno de zona de pruebas seguro, aislado y administrado.
Vertex AI Agent Engine es parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y, luego, implementar agentes de IA.
Crea e implementa en Vertex AI Agent Engine
Nota: Para una experiencia de desarrollo y de implementación basada en IDE optimizada con Vertex AI Agent Engine, considera el paquete de inicio de agentes. Proporciona plantillas listas para usar, una IU integrada para la experimentación y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para compilar un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configura el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrolla un agente | Desarrolla un agente que se pueda implementar en Vertex AI Agent Engine. |
3. Implementa el agente | Implementa el agente en el entorno de ejecución administrado de Vertex AI Agent Engine. |
4. Cómo usar el agente | Envía una solicitud a la API para consultar el agente. |
5. Administra el agente implementado | Administra y borra los agentes que implementaste en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks compatibles
En la siguiente tabla, se describe el nivel de compatibilidad que ofrece Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Vertex AI Agent Engine desde tu framework. | CrewAI, marcos personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas administradas por framework en el SDK y la documentación de Vertex AI. | AG2, LlamaIndex |
Integración completa: Las funciones se integran para trabajar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. | Agent Development Kit (ADK), LangChain, LangGraph |
Implementa en producción con el paquete inicial de agentes
El paquete de inicio de agentes es una colección de plantillas de agentes de IA generativa listas para producción creadas para Vertex AI Agent Engine. El paquete de inicio del agente proporciona lo siguiente:
- Plantillas de agentes prediseñadas: ReAct, RAG, multiagente y otras plantillas.
- Zona de pruebas interactiva: Prueba tu agente e interactúa con él.
- Infraestructura automatizada: Usa Terraform para optimizar la administración de recursos.
- Canalizaciones de CI/CD: Flujos de trabajo de implementación automatizados que aprovechan Cloud Build.
- Observabilidad: Compatibilidad integrada con Cloud Trace y Cloud Logging.
Para comenzar, consulta la Guía de inicio rápido.
Casos de uso
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Caso de uso | Descripción | Vínculos |
---|---|---|
Compila agentes conectándote a APIs públicas | Convierte entre monedas. Crea una función que se conecte a una app de cambio de moneda, lo que permite que el modelo proporcione respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?". |
Notebook del SDK de Vertex AI para Python: Introducción a la compilación y la implementación de un agente con Vertex AI Agent Engine |
Diseña un proyecto de huerto solar. Identifica ubicaciones potenciales, busca oficinas y proveedores gubernamentales relevantes, y revisa imágenes satelitales y el potencial solar de regiones y edificios para encontrar la ubicación óptima para instalar tus paneles solares. |
Notebook de SDK de Vertex AI para Python - Compila e implementa un agente de la API de Google Maps con Vertex AI Agent Engine | |
Crea agentes conectándote a bases de datos | Integración con AlloyDB y Cloud SQL para PostgreSQL | Entrada de blog: Anunciamos LangChain en Vertex AI para AlloyDB y Cloud SQL para PostgreSQL Notebook del SDK de Vertex AI para Python: Implementa una aplicación de RAG con Cloud SQL para PostgreSQL en Vertex AI Agent Engine Notebook del SDK de Vertex AI para Python: Implementa una aplicación de RAG con AlloyDB para PostgreSQL en Vertex AI Agent Engine |
Crea agentes con herramientas que accedan a los datos de tu base de datos. | Notebook del SDK de Vertex AI para Python - Implementa un agente con Vertex AI Agent Engine y MCP Toolbox for Databases | |
Consulta y comprende los almacenes de datos estructurados con lenguaje natural. | Notebook del SDK de Vertex AI para Python - Compila un agente de búsqueda conversacional con Vertex AI Agent Engine y RAG en Vertex AI Search | |
Consulta y comprende bases de datos de grafos con lenguaje natural | Entrada de blog - GenAI GraphRAG y agentes de IA que usan Vertex AI Agent Engine con LangChain y Neo4j | |
Consulta y comprende almacenes de vectores con lenguaje natural | Entrada de blog: Simplifica la API de RAG de GenAI con MongoDB Atlas y Vertex AI Agent Engine | |
Crea agentes con el Kit de desarrollo de agentes | Crea e implementa agentes con el Kit de desarrollo de agentes. | Kit de desarrollo de agentes: Implementa en Vertex AI Agent Engine |
Administra el contexto con las sesiones y el banco de memoria de Vertex AI Agent Engine en el modo express de Vertex AI sin facturación. | Kit de desarrollo de agentes: Sesiones de Vertex AI Agent Engine y banco de memoria en el modo express de Vertex AI. | |
Compila agentes con frameworks de OSS | Compila e implementa agentes con el framework de código abierto OneTwo. | Entrada de blog - OneTwo y Vertex AI Agent Engine: explora el desarrollo avanzado de agentes de IA en Google Cloud |
Compila e implementa agentes con el framework de código abierto LangGraph. | Notebook del SDK de Vertex AI para Python: Compila e implementa una aplicación de LangGraph con Vertex AI Agent Engine | |
Depuración y optimización de agentes | Compila y realiza seguimientos de agentes mediante OpenTelemetry y Cloud Trace. | Cuaderno de notas del SDK de Vertex AI para Python - Agentes de depuración y optimización: Una guía de seguimiento en Vertex AI Agent Engine |
Crea sistemas multiagente con el protocolo A2A (vista previa) | Crea agentes interoperables que se comuniquen y colaboren con otros agentes, independientemente de su framework. | Para obtener más información, consulta la documentación del protocolo A2A. |
Seguridad empresarial
Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir con los requisitos de seguridad de la empresa, respetar las políticas de seguridad de tu organización y seguir las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:
Claves de encriptación administradas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de encriptación, lo que te otorga la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.
Controles del servicio de VPC: Vertex AI Agent Engine admite los Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado conserva el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Cloud SQL Admin y la API de Vertex AI, lo que verifica el funcionamiento sin problemas dentro del perímetro definido. Fundamentalmente, los Controles del servicio de VPC bloquean de manera eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente tu nivel de seguridad empresarial.
Residencia de datos (DRZ): Vertex AI Agent Engine admite la residencia de datos (DRZ) para garantizar que todos los datos en reposo se almacenen dentro de la región especificada.
Interfaz de Private Service Connect: PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC del usuario. Para obtener más información, consulta Usa la interfaz de Private Service Connect con Vertex AI Agent Engine.
HIPAA: Como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de la HIPAA.
Regiones admitidas
Vertex AI Agent Engine y las sesiones de Agent Engine se admiten en las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-east4 |
Virginia del Norte | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-west1 |
Oregón | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west1 |
Bélgica | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west2 |
Londres | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west3 |
Fráncfort | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west4 |
Países Bajos | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-southwest1 |
Madrid | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-east1 |
Taiwán | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-northeast1 |
Tokio | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-south1 |
Bombay | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-southeast1 |
Singapur | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
australia-southeast2 |
Melbourne | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
Para el Banco de memoria de Agent Engine (vista previa), se admiten las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
us-east4 |
Virginia del Norte | Se admite la versión v1beta1 . |
us-west1 |
Oregón | Se admite la versión v1beta1 . |
europe-west1 |
Bélgica | Se admite la versión v1beta1 . |
europe-west4 |
Países Bajos | Se admite la versión v1beta1 . |
europe-southwest1 |
Madrid | Se admite la versión v1beta1 . |
Para Agent Engine Code Execution (vista previa), se admiten las siguientes regiones.
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
Cuota
Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región:Descripción | Límite |
---|---|
Crear, borrar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, borrar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
90 |
Eventos de anexión a sesiones de Vertex AI Agent Engine por minuto | 300 |
Cantidad máxima de recursos de Vertex AI Agent Engine | 100 |
Crear, borrar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar del banco de memoria de Vertex AI Agent Engine por minuto | 300 |
Solicitudes de ejecución por minuto en el entorno de zona de pruebas (ejecución de código) | 1000 |
Entidades del entorno de zona de pruebas (ejecución de código) por región | 1000 |
Solicitudes de publicación de agentes de A2A, como sendMessage y cancelTask por minuto |
60 |
Solicitudes GET del agente de A2A, como getTask y getCard , por minuto |
600 |
Conexiones bidireccionales en vivo simultáneas que usan la API de BidiStreamQuery por minuto |
10 |
Precios
El precio del tiempo de ejecución de Agent Engine se basa en la capacidad de procesamiento (horas de CPU virtual) y la memoria (horas de GiB) que usa tu agente para procesar solicitudes. No se aplican cargos por el tiempo que un agente implementado está inactivo.
Producto | ID de SKU | Precio |
---|---|---|
CPU virtual de ReasoningEngine | 8A55-0B95-B7DC | USD 0.0994 por CPU virtual y hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | USD 0.0105 por GiB-hora |
Para obtener más información, consulta Precios.
Migración al SDK basado en el cliente
El módulo agent_engines
del SDK de Vertex AI para Python se está refactorizando a un diseño basado en el cliente por los siguientes motivos principales:
- Para alinearse con el ADK de Google y el SDK de IA generativa de Google en representaciones de tipos canónicos Esto garantiza una forma coherente y estandarizada de representar los tipos de datos en los diferentes SDKs, lo que simplifica la interoperabilidad y reduce la sobrecarga de conversión.
- Permite definir el alcance a nivel del cliente de los parámetros de Google Cloud en aplicaciones de varios proyectos y varias ubicaciones. Esto permite que una aplicación administre las interacciones con los recursos en diferentes Google Cloud proyectos y ubicaciones geográficas configurando cada instancia del cliente con su proyecto específico y la configuración de ubicación.
- Mejorar la capacidad de descubrimiento y la cohesión de los servicios de Vertex AI Agent Engine