Vertex AI Agent Engine, que forma parte de la plataforma de Vertex AI, es un conjunto de servicios que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Engine administra la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios que puedes usar de forma individual o combinada:
Tiempo de ejecución:
- Implementa y escala agentes con un entorno de ejecución administrado y capacidades de administración de extremo a extremo.
- Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
- Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y de IAM.
- Acceder a modelos y herramientas, como la llamada a función
- Implementa agentes creados con diferentes frameworks de Python:
- Comprende el comportamiento del agente con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
Calidad y evaluación (versión preliminar): Evalúa la calidad del agente con el servicio de evaluación de IA generativa integrado y optimiza los agentes con ejecuciones de entrenamiento de modelos de Gemini.
Almacén de ejemplos (versión preliminar): Almacena y recupera dinámicamente ejemplos de pocos disparos para mejorar el rendimiento del agente.
Sesiones (versión preliminar): Las sesiones de Agent Engine te permiten almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
Memory Bank (versión preliminar): Memory Bank de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones del agente.
Vertex AI Agent Engine es parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y, luego, implementar agentes de IA.
Crea e implementa en Vertex AI Agent Engine
Nota: Para una experiencia de desarrollo y de implementación basada en IDE optimizada con Vertex AI Agent Engine, considera el agent-starter-pack. Proporciona plantillas listas para usar, una IU integrada para la experimentación y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para compilar un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configura el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrolla un agente | Desarrolla un agente que se pueda implementar en Vertex AI Agent Engine. |
3. Implementa el agente | Implementa el agente en el entorno de ejecución administrado de Vertex AI Agent Engine. |
4. Cómo usar el agente | Envía una solicitud a la API para consultar el agente. |
5. Administra el agente implementado | Administra y borra los agentes que implementaste en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks compatibles
En la siguiente tabla, se describe el nivel de compatibilidad que proporciona Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Vertex AI Agent Engine desde tu framework. | CrewAI, marcos personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas administradas por framework en el SDK y la documentación de Vertex AI. | AG2, LlamaIndex |
Integración completa: Las funciones se integran para que funcionen en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. | Agent Development Kit (ADK), LangChain, LangGraph |
Implementa en producción con el paquete inicial de agentes
El paquete de inicio de agentes es una colección de plantillas de agentes de IA generativa listas para producción creadas para Vertex AI Agent Engine. El paquete de inicio del agente proporciona lo siguiente:
- Plantillas de agentes prediseñadas: ReAct, RAG, multiagente y otras plantillas.
- Zona de pruebas interactiva: Prueba tu agente e interactúa con él.
- Infraestructura automatizada: Usa Terraform para optimizar la administración de recursos.
- Canalizaciones de CI/CD: Flujos de trabajo de implementación automatizados que aprovechan Cloud Build.
- Observabilidad: Compatibilidad integrada con Cloud Trace y Cloud Logging.
Para comenzar, consulta la Guía de inicio rápido.
Casos de uso
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Seguridad empresarial
Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir con los requisitos de seguridad de la empresa, respetar las políticas de seguridad de tu organización y seguir las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:
Claves de encriptación administradas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de encriptación, lo que te otorga la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.
Controles del servicio de VPC: Vertex AI Agent Engine admite los Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado conserva el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Cloud SQL Admin y la API de Vertex AI, lo que verifica el funcionamiento sin problemas dentro del perímetro definido. Fundamentalmente, los Controles del servicio de VPC bloquean de manera eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente tu nivel de seguridad empresarial.
Interfaz de Private Service Connect: PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC del usuario. Para obtener más información, consulta Cómo configurar la interfaz de los Controles del servicio de VPC.
HIPAA: Como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de la HIPAA.
Regiones admitidas
Vertex AI Agent Engine es compatible con las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-east4 |
Virginia del Norte | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
us-west1 |
Oregón | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west1 |
Bélgica | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west2 |
Londres | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west3 |
Fráncfort | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-west4 |
Países Bajos | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
europe-southwest1 |
Madrid | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-east1 |
Taiwán | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-northeast1 |
Tokio | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-south1 |
Bombay | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
asia-southeast1 |
Singapur | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
australia-southeast2 |
Melbourne | Se admite v1 para las funciones de DG. v1beta1 es compatible con las funciones de vista previa. |
Para el banco de memoria de Agent Engine (vista previa), se admiten las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
us-east4 |
Virginia del Norte | Se admite la versión v1beta1 . |
us-west1 |
Oregón | Se admite la versión v1beta1 . |
europe-west1 |
Bélgica | Se admite la versión v1beta1 . |
europe-west4 |
Países Bajos | Se admite la versión v1beta1 . |
europe-southwest1 |
Madrid | Se admite la versión v1beta1 . |
Cuota
Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región:Descripción | Límite |
---|---|
Crear, borrar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, borrar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
90 |
Eventos de anexión a sesiones de Vertex AI Agent Engine por minuto | 300 |
Cantidad máxima de recursos de Vertex AI Agent Engine | 100 |
Crear, borrar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar del banco de memoria de Vertex AI Agent Engine por minuto | 300 |
Precios
El precio del tiempo de ejecución de Agent Engine se basa en la capacidad de procesamiento (horas de CPU virtual) y la memoria (horas de GiB) que usa tu agente para procesar solicitudes. No se aplican cargos por el tiempo que un agente implementado está inactivo.
Producto | ID de SKU | Precio |
---|---|---|
CPU virtual de ReasoningEngine | 8A55-0B95-B7DC | USD 0.0994 por CPU virtual y hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | USD 0.0105 por GiB-hora |
Para obtener más información, consulta Precios.