Vertex AI Agent Engine, que forma parte de la plataforma Vertex AI, es un conjunto de servicios que permite a los desarrolladores desplegar, gestionar y escalar agentes de IA en producción. Agent Engine se encarga de la infraestructura para escalar los agentes en producción, de forma que puedas centrarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios, que puedes usar de forma individual o combinada:
Tiempo de ejecución:
- Despliega y escala agentes con un entorno de ejecución gestionado y funciones de gestión integrales.
- Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
- Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la gestión de identidades y accesos.
- Acceder a modelos y herramientas como llamada de función.
- Desplegar agentes creados con diferentes frameworks de Python:
- Comprende el comportamiento del agente con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
Calidad y evaluación (vista previa): evalúa la calidad de los agentes con el servicio de evaluación de IA generativa integrado y optimiza los agentes con las ejecuciones de entrenamiento del modelo de Gemini.
Tienda de ejemplos (vista previa): almacena y recupera de forma dinámica ejemplos de pocos disparos para mejorar el rendimiento del agente.
Sesiones (vista previa): Agent Engine Sessions te permite almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
Banco de memoria (vista previa): el banco de memoria de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones con el agente.
Vertex AI Agent Engine forma parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y desplegar agentes de IA.
Crear y desplegar en Vertex AI Agent Engine
Nota: Para disfrutar de una experiencia de desarrollo y despliegue optimizada y basada en IDE con Vertex AI Agent Engine, consulta el paquete de inicio de agente. Proporciona plantillas listas para usar, una interfaz de usuario integrada para experimentar y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.
El flujo de trabajo para crear un agente en Vertex AI Agent Engine es el siguiente:
Pasos | Descripción |
---|---|
1. Configurar el entorno | Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python. |
2. Desarrollar un agente | Desarrollar un agente que se pueda desplegar en Vertex AI Agent Engine. |
3. Desplegar el agente | Despliega el agente en el entorno de ejecución gestionado de Vertex AI Agent Engine. |
4. Usar el agente | Consulta el agente enviando una solicitud a la API. |
5. Gestionar el agente desplegado | Gestiona y elimina los agentes que hayas desplegado en Vertex AI Agent Engine. |
Los pasos se ilustran en el siguiente diagrama:
Frameworks admitidos
En la siguiente tabla se describe el nivel de asistencia que ofrece Vertex AI Agent Engine para varios frameworks de agentes:
Nivel de asistencia | Frameworks de agentes |
---|---|
Plantilla personalizada: puedes adaptar una plantilla personalizada para que admita el despliegue en Vertex AI Agent Engine desde tu framework. | CrewAI y frameworks personalizados |
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas gestionadas por framework en el SDK de Vertex AI y en la documentación. | AG2, LlamaIndex |
Integración completa: las funciones se integran para funcionar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. | Agent Development Kit (ADK), LangChain y LangGraph |
Despliega en producción con el paquete inicial de agentes
El paquete inicial de agentes es una colección de plantillas de agentes de IA generativa listas para la producción creadas para Vertex AI Agent Engine. El paquete de inicio para agentes incluye lo siguiente:
- Plantillas de agentes predefinidas: ReAct, RAG, multiagente y otras plantillas.
- Zona de pruebas interactiva: prueba tu agente e interactúa con él.
- Infraestructura automatizada: usa Terraform para simplificar la gestión de recursos.
- Flujos de procesamiento de CI/CD: flujos de trabajo de despliegue automatizados que aprovechan Cloud Build.
- Observabilidad: compatibilidad integrada con Cloud Trace y Cloud Logging.
Para empezar, consulta la guía de inicio rápido.
Casos prácticos
Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:
Seguridad empresarial
Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir los requisitos de seguridad de las empresas, seguir las políticas de seguridad de tu organización y aplicar las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:
Claves de cifrado gestionadas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de cifrado, lo que te da la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.
Controles de Servicio de VPC: Vertex AI Agent Engine admite Controles de Servicio de VPC para reforzar la seguridad de los datos y mitigar los riesgos de filtración externa de datos. Cuando se configura Controles de Servicio de VPC, el agente implementado mantiene el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de administrador de Cloud SQL y la API de Vertex AI, lo que garantiza un funcionamiento fluido dentro del perímetro definido. Lo más importante es que Controles de Servicio de VPC bloquea de forma eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente la postura de seguridad de tu empresa.
Interfaz de Private Service Connect: PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC del usuario. Para obtener más información, consulta Configurar la interfaz de Controles de Servicio de VPC.
HIPAA como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de conformidad con la HIPAA.
Regiones disponibles
Vertex AI Agent Engine está disponible en las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
us-east4 |
Norte de Virginia | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
us-west1 |
Oregón | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west1 |
Bélgica | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west2 |
Londres | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west3 |
Fráncfort | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-west4 |
Países Bajos | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
europe-southwest1 |
Madrid | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-east1 |
Taiwán | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-northeast1 |
Tokio | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-south1 |
Bombay | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
asia-southeast1 |
Singapur | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
australia-southeast2 |
Melbourne | v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa. |
En el caso de Agent Engine Memory Bank (vista previa), se admiten las siguientes regiones:
Región | Ubicación | Versiones compatibles |
---|---|---|
us-central1 |
Iowa | Se admite la versión v1beta1 . |
us-east4 |
Norte de Virginia | Se admite la versión v1beta1 . |
us-west1 |
Oregón | Se admite la versión v1beta1 . |
europe-west1 |
Bélgica | Se admite la versión v1beta1 . |
europe-west4 |
Países Bajos | Se admite la versión v1beta1 . |
europe-southwest1 |
Madrid | Se admite la versión v1beta1 . |
Cuota
Se aplican los siguientes límites a Vertex AI Agent Engine en cada región de un proyecto determinado:Descripción | Límite |
---|---|
Crear, eliminar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, eliminar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
90 |
Añadir eventos a las sesiones de Vertex AI Agent Engine por minuto | 300 |
Número máximo de recursos de Vertex AI Agent Engine | 100 |
Crear, eliminar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar datos de Memory Bank de Vertex AI Agent Engine por minuto | 300 |
Precios
Los precios de Agent Engine Runtime se basan en los recursos de computación (horas de vCPU) y memoria (horas de GiB) que usa tu agente para procesar las solicitudes. No se cobra por el tiempo que un agente implementado está inactivo.
Producto | ID de SKU | Precio |
---|---|---|
vCPU de ReasoningEngine | 8A55-0B95-B7DC | 0,0994 USD por vCPU y hora |
Memoria de ReasoningEngine | 0B45-6103-6EC1 | 0,0105 USD/GiB por hora |
Para obtener más información, consulta los precios.