Información general sobre Vertex AI Agent Engine

Vertex AI Agent Engine, que forma parte de la plataforma Vertex AI, es un conjunto de servicios que permite a los desarrolladores desplegar, gestionar y escalar agentes de IA en producción. Agent Engine se encarga de la infraestructura para escalar los agentes en producción, de forma que puedas centrarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios, que puedes usar de forma individual o combinada:

  • Tiempo de ejecución:

    • Despliega y escala agentes con un entorno de ejecución gestionado y funciones de gestión integrales.
    • Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
    • Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la gestión de identidades y accesos.
    • Acceder a modelos y herramientas como llamada de función.
    • Desplegar agentes creados con diferentes frameworks de Python:
    • Comprende el comportamiento del agente con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
  • Calidad y evaluación (vista previa): evalúa la calidad de los agentes con el servicio de evaluación de IA generativa integrado y optimiza los agentes con las ejecuciones de entrenamiento del modelo de Gemini.

  • Tienda de ejemplos (vista previa): almacena y recupera de forma dinámica ejemplos de pocos disparos para mejorar el rendimiento del agente.

  • Sesiones (vista previa): Agent Engine Sessions te permite almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.

  • Banco de memoria (vista previa): el banco de memoria de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones con el agente.

Información general sobre Vertex AI Agent Engine

Vertex AI Agent Engine forma parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y desplegar agentes de IA.

Crear y desplegar en Vertex AI Agent Engine

Nota: Para disfrutar de una experiencia de desarrollo y despliegue optimizada y basada en IDE con Vertex AI Agent Engine, consulta el paquete de inicio de agente. Proporciona plantillas listas para usar, una interfaz de usuario integrada para experimentar y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.

El flujo de trabajo para crear un agente en Vertex AI Agent Engine es el siguiente:

Pasos Descripción
1. Configurar el entorno Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python.
2. Desarrollar un agente Desarrollar un agente que se pueda desplegar en Vertex AI Agent Engine.
3. Desplegar el agente Despliega el agente en el entorno de ejecución gestionado de Vertex AI Agent Engine.
4. Usar el agente Consulta el agente enviando una solicitud a la API.
5. Gestionar el agente desplegado Gestiona y elimina los agentes que hayas desplegado en Vertex AI Agent Engine.

Los pasos se ilustran en el siguiente diagrama:

Crear y desplegar un agente 

Frameworks admitidos

En la siguiente tabla se describe el nivel de asistencia que ofrece Vertex AI Agent Engine para varios frameworks de agentes:

Nivel de asistencia Frameworks de agentes
Plantilla personalizada: puedes adaptar una plantilla personalizada para que admita el despliegue en Vertex AI Agent Engine desde tu framework. CrewAI y frameworks personalizados
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas gestionadas por framework en el SDK de Vertex AI y en la documentación. AG2, LlamaIndex
Integración completa: las funciones se integran para funcionar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. Agent Development Kit (ADK), LangChain y LangGraph

Despliega en producción con el paquete inicial de agentes

El paquete inicial de agentes es una colección de plantillas de agentes de IA generativa listas para la producción creadas para Vertex AI Agent Engine. El paquete de inicio para agentes incluye lo siguiente:

  • Plantillas de agentes predefinidas: ReAct, RAG, multiagente y otras plantillas.
  • Zona de pruebas interactiva: prueba tu agente e interactúa con él.
  • Infraestructura automatizada: usa Terraform para simplificar la gestión de recursos.
  • Flujos de procesamiento de CI/CD: flujos de trabajo de despliegue automatizados que aprovechan Cloud Build.
  • Observabilidad: compatibilidad integrada con Cloud Trace y Cloud Logging.

Para empezar, consulta la guía de inicio rápido.

Casos prácticos

Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:

Caso práctico Descripción Enlaces
Crear agentes conectándose a APIs públicas Convertir entre monedas.

Crea una función que se conecte a una aplicación de cambio de divisas para que el modelo pueda proporcionar respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?".
Notebook del SDK de Vertex AI para Python: introducción a la creación y la implementación de un agente con Vertex AI Agent Engine
Diseñar un proyecto de energía solar comunitaria.

Identifica posibles ubicaciones, busca las oficinas gubernamentales y los proveedores pertinentes, y consulta imágenes de satélite y el potencial solar de las regiones y los edificios para encontrar la ubicación óptima donde instalar tus paneles solares.
Notebook del SDK de Vertex AI para Python: creación e implementación de un agente de la API de Google Maps con Vertex AI Agent Engine
Crear agentes conectándose a bases de datos Integración con AlloyDB y Cloud SQL para PostgreSQL. Entrada de blog: presentamos LangChain en Vertex AI para AlloyDB y Cloud SQL para PostgreSQL

Notebook del SDK de Vertex AI para Python: implementar una aplicación RAG con Cloud SQL para PostgreSQL en Vertex AI Agent Engine

Notebook del SDK de Vertex AI para Python: implementar una aplicación RAG con AlloyDB para PostgreSQL en Vertex AI Agent Engine
Crea agentes con herramientas que accedan a los datos de tu base de datos. Notebook del SDK de Vertex AI para Python: desplegar un agente con Vertex AI Agent Engine y MCP Toolbox for Databases
Consulta y comprende almacenes de datos estructurados usando lenguaje natural. Notebook del SDK de Vertex AI para Python: crear un agente de búsqueda conversacional con Vertex AI Agent Engine y RAG en Vertex AI Search
Consultar y comprender bases de datos de grafos con lenguaje natural Entrada de blog: GenAI GraphRAG y agentes de IA con Vertex AI Agent Engine, LangChain y Neo4j
Consultar y comprender almacenes de vectores con lenguaje natural Entrada de blog: Simplifica la función de RAG de la IA generativa con MongoDB Atlas y Vertex AI Agent Engine
Crear agentes con Agent Development Kit (versión preliminar) Crea y despliega agentes con Agent Development Kit. Agent Development Kit: desplegar en Vertex AI Agent Engine
Gestiona el contexto con las sesiones de Vertex AI Agent Engine y Memory Bank en el modo Exprés de Vertex AI sin facturación. Agent Development Kit: sesiones de Vertex AI Agent Engine y Memory Bank en el modo exprés de Vertex AI.
Crear agentes con frameworks de OSS Crea y despliega agentes con el framework de código abierto OneTwo. Entrada de blog: OneTwo y Vertex AI Agent Engine: explorando el desarrollo avanzado de agentes de IA en Google Cloud
Crea y despliega agentes con el framework de código abierto LangGraph. Notebook del SDK de Vertex AI para Python: crear e implementar una aplicación LangGraph con Vertex AI Agent Engine
Depurar y optimizar agentes Crea y monitoriza agentes con OpenTelemetry y Cloud Trace. Notebook del SDK de Vertex AI para Python: depuración y optimización de agentes. Guía para el seguimiento en Vertex AI Agent Engine

Seguridad empresarial

Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir los requisitos de seguridad de las empresas, seguir las políticas de seguridad de tu organización y aplicar las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:

  • Claves de cifrado gestionadas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de cifrado, lo que te da la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.

  • Controles de Servicio de VPC: Vertex AI Agent Engine admite Controles de Servicio de VPC para reforzar la seguridad de los datos y mitigar los riesgos de filtración externa de datos. Cuando se configura Controles de Servicio de VPC, el agente implementado mantiene el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de administrador de Cloud SQL y la API de Vertex AI, lo que garantiza un funcionamiento fluido dentro del perímetro definido. Lo más importante es que Controles de Servicio de VPC bloquea de forma eficaz todo el acceso a Internet público, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente la postura de seguridad de tu empresa.

  • Interfaz de Private Service Connect: PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC del usuario. Para obtener más información, consulta Configurar la interfaz de Controles de Servicio de VPC.

  • HIPAA como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de conformidad con la HIPAA.

Regiones disponibles

Vertex AI Agent Engine está disponible en las siguientes regiones:

Región Ubicación Versiones compatibles
us-central1 Iowa v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
us-east4 Norte de Virginia v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
us-west1 Oregón v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
europe-west1 Bélgica v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
europe-west2 Londres v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
europe-west3 Fráncfort v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
europe-west4 Países Bajos v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
europe-southwest1 Madrid v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
asia-east1 Taiwán v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
asia-northeast1 Tokio v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
asia-south1 Bombay v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
asia-southeast1 Singapur v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.
australia-southeast2 Melbourne v1 es compatible con las funciones de GA. v1beta1 se admite en las funciones de vista previa.

En el caso de Agent Engine Memory Bank (vista previa), se admiten las siguientes regiones:

Región Ubicación Versiones compatibles
us-central1 Iowa Se admite la versión v1beta1.
us-east4 Norte de Virginia Se admite la versión v1beta1.
us-west1 Oregón Se admite la versión v1beta1.
europe-west1 Bélgica Se admite la versión v1beta1.
europe-west4 Países Bajos Se admite la versión v1beta1.
europe-southwest1 Madrid Se admite la versión v1beta1.

Cuota

Se aplican los siguientes límites a Vertex AI Agent Engine en cada región de un proyecto determinado:
Descripción Límite
Crear, eliminar o actualizar Vertex AI Agent Engine por minuto 10
Crear, eliminar o actualizar sesiones de Vertex AI Agent Engine por minuto 100
Query o StreamQuery Vertex AI Agent Engine por minuto 90
Añadir eventos a las sesiones de Vertex AI Agent Engine por minuto 300
Número máximo de recursos de Vertex AI Agent Engine 100
Crear, eliminar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto 100
Obtener, enumerar o recuperar datos de Memory Bank de Vertex AI Agent Engine por minuto 300

Precios

Los precios de Agent Engine Runtime se basan en los recursos de computación (horas de vCPU) y memoria (horas de GiB) que usa tu agente para procesar las solicitudes. No se cobra por el tiempo que un agente implementado está inactivo.

Producto ID de SKU Precio
vCPU de ReasoningEngine 8A55-0B95-B7DC 0,0994 USD por vCPU y hora
Memoria de ReasoningEngine 0B45-6103-6EC1 0,0105 USD/GiB por hora

Para obtener más información, consulta los precios.

Siguientes pasos