Vertex AI Agent Engine, que forma parte de la plataforma Vertex AI, es un conjunto de servicios que permite a los desarrolladores desplegar, gestionar y escalar agentes de IA en producción. Agent Engine se encarga de la infraestructura para escalar los agentes en producción, de forma que puedas centrarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios, que puedes usar de forma individual o combinada:
Tiempo de ejecución:
- Despliega y escala agentes con un entorno de ejecución gestionado y funciones de gestión integrales.
- Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
- Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la gestión de identidades y accesos.
- Acceder a modelos y herramientas como llamada de función.
- Despliega agentes creados con diferentes frameworks de Python y el protocolo abierto Agent2Agent.
- Comprende el comportamiento del agente con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
Calidad y evaluación (vista previa): evalúa la calidad de los agentes con el servicio de evaluación de IA generativa integrado y optimiza los agentes con las ejecuciones de entrenamiento del modelo de Gemini.
Tienda de ejemplos (vista previa): almacena y recupera de forma dinámica ejemplos de pocos disparos para mejorar el rendimiento del agente.
Sesiones (vista previa): Agent Engine Sessions te permite almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
Banco de memoria (vista previa): el banco de memoria de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones con el agente.
Ejecución de código (Vista previa): la ejecución de código de Agent Engine permite que tu agente ejecute código en un entorno de pruebas seguro, aislado y gestionado.
Vertex AI Agent Engine forma parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y desplegar agentes de IA.
Crear y desplegar en Vertex AI Agent Engine
Nota: Para disfrutar de una experiencia de desarrollo y despliegue optimizada y basada en IDE con Vertex AI Agent Engine, consulta el paquete de inicio de agente. Proporciona plantillas listas para usar, una interfaz de usuario integrada para experimentar y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para crear un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configurar el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrollar un agente | Desarrollar un agente que se pueda desplegar en Vertex AI Agent Engine. |
3. Desplegar el agente | Despliega el agente en el entorno de ejecución gestionado de Vertex AI Agent Engine. |
4. Usar el agente | Consulta el agente enviando una solicitud a la API. |
5. Gestionar el agente desplegado | Gestiona y elimina los agentes que hayas desplegado en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks admitidos
En la siguiente tabla se describe el nivel de asistencia que ofrece Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: puedes adaptar una plantilla personalizada para que admita el despliegue en Vertex AI Agent Engine desde tu framework. | CrewAI y frameworks personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas gestionadas por framework en el SDK de Vertex AI y en la documentación. | AG2, LlamaIndex |
Integración completa: las funciones se integran para funcionar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. | Agent Development Kit (ADK), LangChain y LangGraph |
Despliega en producción con el paquete inicial de agentes
El paquete inicial de agentes es una colección de plantillas de agentes de IA generativa listas para la producción creadas para Vertex AI Agent Engine. El paquete de inicio para agentes incluye lo siguiente:
- Plantillas de agentes predefinidas: ReAct, RAG, multiagente y otras plantillas.
- Zona de pruebas interactiva: prueba tu agente e interactúa con él.
- Infraestructura automatizada: usa Terraform para simplificar la gestión de recursos.
- Flujos de procesamiento de CI/CD: flujos de trabajo de despliegue automatizados que aprovechan Cloud Build.
- Observabilidad: compatibilidad integrada con Cloud Trace y Cloud Logging.
Para empezar, consulta la guía de inicio rápido.
Casos prácticos
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Caso práctico | Descripción | Enlaces |
---|---|---|
Crear agentes conectándose a APIs públicas | Convertir entre monedas. Crea una función que se conecte a una aplicación de cambio de divisas para que el modelo pueda proporcionar respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?". |
Notebook del SDK de Vertex AI para Python: introducción a la creación y la implementación de un agente con Vertex AI Agent Engine |
Diseñar un proyecto de energía solar comunitaria. Identifica posibles ubicaciones, busca las oficinas gubernamentales y los proveedores pertinentes, y consulta imágenes de satélite y el potencial solar de las regiones y los edificios para encontrar la ubicación óptima donde instalar tus paneles solares. |
Notebook del SDK de Vertex AI para Python: creación e implementación de un agente de la API de Google Maps con Vertex AI Agent Engine | |
Crear agentes conectándose a bases de datos | Integración con AlloyDB y Cloud SQL para PostgreSQL. | Entrada de blog: presentamos LangChain en Vertex AI para AlloyDB y Cloud SQL para PostgreSQL Notebook del SDK de Vertex AI para Python: implementar una aplicación RAG con Cloud SQL para PostgreSQL en Vertex AI Agent Engine Notebook del SDK de Vertex AI para Python: implementar una aplicación RAG con AlloyDB para PostgreSQL en Vertex AI Agent Engine |
Crea agentes con herramientas que accedan a los datos de tu base de datos. | Notebook del SDK de Vertex AI para Python: desplegar un agente con Vertex AI Agent Engine y MCP Toolbox for Databases | |
Consulta y comprende almacenes de datos estructurados usando lenguaje natural. | Notebook del SDK de Vertex AI para Python: crear un agente de búsqueda conversacional con Vertex AI Agent Engine y RAG en Vertex AI Search | |
Consultar y comprender bases de datos de grafos con lenguaje natural | Entrada de blog: GenAI GraphRAG y agentes de IA con Vertex AI Agent Engine, LangChain y Neo4j | |
Consultar y comprender almacenes de vectores con lenguaje natural | Entrada de blog: Simplifica la función de RAG de la IA generativa con MongoDB Atlas y Vertex AI Agent Engine | |
Crear agentes con Agent Development Kit | Crea y despliega agentes con Agent Development Kit. | Agent Development Kit: desplegar en Vertex AI Agent Engine |
Gestiona el contexto con las sesiones de Vertex AI Agent Engine y Memory Bank en el modo Exprés de Vertex AI sin facturación. | Agent Development Kit: sesiones de Vertex AI Agent Engine y Memory Bank en el modo exprés de Vertex AI. | |
Crear agentes con frameworks de OSS | Crea y despliega agentes con el framework de código abierto OneTwo. | Entrada de blog: OneTwo y Vertex AI Agent Engine: explorando el desarrollo avanzado de agentes de IA en Google Cloud |
Crea y despliega agentes con el framework de código abierto LangGraph. | Notebook del SDK de Vertex AI para Python: crear e implementar una aplicación LangGraph con Vertex AI Agent Engine | |
Depurar y optimizar agentes | Crea y monitoriza agentes con OpenTelemetry y Cloud Trace. | Notebook del SDK de Vertex AI para Python: depuración y optimización de agentes. Guía para el seguimiento en Vertex AI Agent Engine |
Crear sistemas multiagente con el protocolo A2A (vista previa) | Crea agentes interoperables que se comuniquen y colaboren con otros agentes independientemente de su framework. | Para obtener más información, consulta la documentación del protocolo A2A. |
Seguridad empresarial
Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir los requisitos de seguridad de las empresas, seguir las políticas de seguridad de tu organización y aplicar las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:
Claves de cifrado gestionadas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de cifrado, lo que te da la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.
Controles de Servicio de VPC: Vertex AI Agent Engine admite Controles de Servicio de VPC para reforzar la seguridad de los datos y mitigar los riesgos de filtración externa de datos. Cuando se configura Controles de Servicio de VPC, el agente implementado mantiene el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de administrador de Cloud SQL y la API de Vertex AI, lo que garantiza un funcionamiento fluido dentro del perímetro definido. Lo más importante es que Controles de Servicio de VPC bloquea de forma eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente la postura de seguridad de tu empresa.
Residencia de datos (DRZ): Vertex AI Agent Engine admite la residencia de datos (DRZ) para asegurarse de que todos los datos en reposo se almacenan en la región especificada.
Interfaz de Private Service Connect: PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC del usuario. Para obtener más información, consulta Usar la interfaz de Private Service Connect con Vertex AI Agent Engine.
HIPAA como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de conformidad con la HIPAA.
Regiones disponibles
Vertex AI Agent Engine y Agent Engine Sessions se admiten en las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
us-east4 |
Norte de Virginia | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
us-west1 |
Oregón | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west1 |
Bélgica | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west2 |
Londres | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west3 |
Fráncfort | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west4 |
Países Bajos | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-southwest1 |
Madrid | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-east1 |
Taiwán | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-northeast1 |
Tokio | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-south1 |
Bombay | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-southeast1 |
Singapur | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
australia-southeast2 |
Melbourne | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
En el caso de Agent Engine Memory Bank (vista previa), se admiten las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
us-east4 |
Norte de Virginia | Se admite la versión v1beta1 . |
us-west1 |
Oregón | Se admite la versión v1beta1 . |
europe-west1 |
Bélgica | Se admite la versión v1beta1 . |
europe-west4 |
Países Bajos | Se admite la versión v1beta1 . |
europe-southwest1 |
Madrid | Se admite la versión v1beta1 . |
En Ejecución de código de Agent Engine (vista previa), se admiten las siguientes regiones.
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
Cuota
Se aplican los siguientes límites a Vertex AI Agent Engine en cada región de un proyecto determinado:Descripción | Límite |
---|---|
Crear, eliminar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, eliminar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
90 |
Añadir eventos a las sesiones de Vertex AI Agent Engine por minuto | 300 |
Número máximo de recursos de Vertex AI Agent Engine | 100 |
Crear, eliminar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar datos de Memory Bank de Vertex AI Agent Engine por minuto | 300 |
Solicitudes de ejecución por minuto del entorno de pruebas (ejecución de código) | 1000 |
Entidades de entorno aislado (ejecución de código) por región | 1000 |
Solicitudes POST de agentes de A2A, como sendMessage y cancelTask por minuto |
60 |
Solicitudes get de agente de A2A, como getTask y getCard , por minuto |
600 |
Conexiones bidireccionales simultáneas en directo mediante la API BidiStreamQuery por minuto |
10 |
Precios
Los precios de Agent Engine Runtime se basan en los recursos de computación (horas de vCPU) y memoria (horas de GiB) que usa tu agente para procesar las solicitudes. No se cobra por el tiempo que un agente implementado está inactivo.
Producto | ID de SKU | Precio |
---|---|---|
vCPU de ReasoningEngine | 8A55-0B95-B7DC | 0,0994 USD por vCPU y hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | 0,0105 USD/GiB por hora |
Para obtener más información, consulta los precios.
Migración al SDK basado en el cliente
El módulo agent_engines
del SDK de Vertex AI para Python se está refactorizando para que tenga un diseño basado en clientes por los siguientes motivos principales:
- Para que coincida con el ADK de Google y el SDK de IA generativa de Google en representaciones de tipos canónicos. De esta forma, se garantiza una representación coherente y estandarizada de los tipos de datos en diferentes SDKs, lo que simplifica la interoperabilidad y reduce la sobrecarga de conversión.
- Para definir el ámbito de los parámetros Google Cloud a nivel de cliente en aplicaciones de varios proyectos y varias ubicaciones. De esta forma, una aplicación puede gestionar las interacciones con recursos de diferentes Google Cloud proyectos y ubicaciones geográficas configurando cada instancia de cliente con sus ajustes de proyecto y ubicación específicos.
- Para mejorar la visibilidad y la cohesión de los servicios de Vertex AI Agent Engine