Vista geral do Vertex AI Agent Engine

O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos programadores implementar, gerir e dimensionar agentes de IA em produção. O Agent Engine processa a infraestrutura para dimensionar agentes em produção, para que possa concentrar-se na criação de aplicações. O Vertex AI Agent Engine oferece os seguintes serviços que pode usar individualmente ou em combinação:

  • Tempo de execução:

  • Qualidade e avaliação (pré-visualização): avalie a qualidade do agente com o serviço de avaliação de IA gen integrado e otimize os agentes com execuções de preparação do modelo Gemini.

  • Exemplo de loja (pré-visualização): armazene e obtenha dinamicamente exemplos de poucos disparos para melhorar o desempenho do agente.

  • Sessões (pré-visualização): as sessões do motor de agentes permitem-lhe armazenar interações individuais entre utilizadores e agentes, fornecendo fontes definitivas para o contexto da conversa.

  • Memory Bank (pré-visualização): o Memory Bank do Agent Engine permite-lhe armazenar e obter informações das sessões para personalizar as interações do agente.

  • Execução de código (Pré-visualização): a execução de código do motor do agente permite que o seu agente execute código num ambiente de área de testes seguro, isolado e gerido.

Vista geral conceptual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de funcionalidades para descobrir, criar e implementar agentes de IA.

Crie e implemente no Vertex AI Agent Engine

Nota: para uma experiência de desenvolvimento e implementação simplificada baseada no IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Oferece modelos prontos a usar, uma IU incorporada para experimentação e simplifica a implementação, as operações, a avaliação, a personalização e a observabilidade.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:

Passos Descrição
1. Configure o ambiente Configure o seu projeto Google e instale a versão mais recente do SDK Vertex AI para Python.
2. Desenvolva um agente Desenvolva um agente que possa ser implementado no Vertex AI Agent Engine.
3. Implemente o agente Implemente o agente no tempo de execução gerido do Vertex AI Agent Engine.
4. Use o agente Consultar o agente enviando um pedido de API.
5. Faça a gestão do agente implementado Gerir e eliminar agentes que implementou no Vertex AI Agent Engine.

Os passos são ilustrados no diagrama seguinte:

Crie e implemente um agente 

Frameworks suportados

A tabela seguinte descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias frameworks de agentes:

Nível de apoio técnico Frameworks de agentes
Modelo personalizado: pode adaptar um modelo personalizado para suportar a implementação no Vertex AI Agent Engine a partir da sua framework. CrewAI, estruturas personalizadas
Integração do SDK Vertex AI: o Vertex AI Agent Engine fornece modelos geridos por framework no SDK Vertex AI e na documentação. AG2, LlamaIndex
Integração total: as funcionalidades estão integradas para funcionar na estrutura, no Vertex AI Agent Engine e no Google Cloud ecossistema mais amplo. Agent Development Kit (ADK), LangChain, LangGraph

Implemente na produção com o Agent Starter Pack

O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O Agent Starter Pack oferece o seguinte:

  • Modelos de agentes pré-criados: ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com o seu agente.
  • Infraestrutura automatizada: usa o Terraform para uma gestão de recursos simplificada.
  • Pipelines de CI/CD: fluxos de trabalho de implementação automatizados que tiram partido do Cloud Build.
  • Observabilidade: apoio técnico integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Início rápido.

Exemplos de utilização

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Exemplo de utilização Descrição Links
Crie agentes estabelecendo ligação a APIs públicas Fazer conversões entre moedas.

Crie uma função que se ligue a uma app de câmbio de moeda, permitindo que o modelo forneça respostas precisas a consultas como "Qual é a taxa de câmbio de euros para dólares hoje?"
Notebook do SDK Vertex AI para Python: introdução à criação e implementação de um agente com o Vertex AI Agent Engine
Conceber um projeto de energia solar comunitária.

Identifique potenciais localizações, procure fornecedores e organismos governamentais relevantes e reveja imagens de satélite e o potencial solar de regiões e edifícios para encontrar a localização ideal para instalar os seus painéis solares.
Notebook do SDK Vertex AI para Python: criar e implementar um agente da API Google Maps com o Vertex AI Agent Engine
Crie agentes associando-os a bases de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Publicação no blogue: anúncio do LangChain no Vertex AI para o AlloyDB e o Cloud SQL para PostgreSQL

Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine

Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
Crie agentes com ferramentas que acedem aos dados na sua base de dados. Notebook do SDK Vertex AI para Python: implementação de um agente com o Vertex AI Agent Engine e o MCP Toolbox for Databases
Consultar e compreender repositórios de dados estruturados através de linguagem natural. Bloco de notas do SDK Vertex AI para Python: criar um agente de pesquisa conversacional com o Vertex AI Agent Engine e a RAG na Vertex AI Search
Consultar e compreender bases de dados de grafos através da linguagem natural Publicação no blogue: IA gen GraphRAG e agentes de IA com o Vertex AI Agent Engine com LangChain e Neo4j
Consultar e compreender bases de dados vetoriais através da linguagem natural Publicação no blogue: simplifique a RAG de IA gen com o MongoDB Atlas e o Vertex AI Agent Engine
Crie agentes com o Agent Development Kit Crie e implemente agentes com o Agent Development Kit. Agent Development Kit – Implementação no Vertex AI Agent Engine
Faça a gestão do contexto com as sessões do Vertex AI Agent Engine e o banco de memória no modo expresso do Vertex AI sem faturação. Agent Development Kit: sessões do Vertex AI Agent Engine e banco de memória no modo expresso do Vertex AI.
Crie agentes com frameworks de software de código aberto Crie e implemente agentes com a framework de código aberto OneTwo. Publicação no blogue - OneTwo e Vertex AI Agent Engine: explorar o desenvolvimento avançado de agentes de IA na Google Cloud
Crie e implemente agentes através da framework de código aberto LangGraph. Notebook do SDK Vertex AI para Python: criar e implementar uma aplicação LangGraph com o Vertex AI Agent Engine
Depurar e otimizar agentes Crie e rastreie agentes com o OpenTelemetry e o Cloud Trace. Vertex AI SDK for Python notebook - Debugging and Optimizing Agents: A Guide to Tracing in Vertex AI Agent Engine
Crie sistemas multiagentes com o protocolo A2A (pré-visualização) Crie agentes interoperáveis que comunicam e colaboram com outros agentes, independentemente da respetiva estrutura. Para mais informações, consulte a documentação do protocolo A2A.

Segurança empresarial

O Vertex AI Agent Engine suporta várias funcionalidades para ajudar a cumprir os requisitos de segurança empresariais, a seguir as políticas de segurança da sua organização e a seguir as práticas recomendadas de segurança. As seguintes funcionalidades são suportadas:

  • Chaves de encriptação geridas pelo cliente (CMEK): o Vertex AI Agent Engine suporta CMEK para proteger os seus dados com as suas próprias chaves de encriptação, o que lhe dá a propriedade e o controlo total das chaves que protegem os seus dados em repouso no Google Cloud. Para mais informações, consulte o artigo CMEK do Agent Engine.

  • VPC Service Controls: o Vertex AI Agent Engine suporta os VPC Service Controls para reforçar a segurança dos dados e mitigar os riscos de exfiltração de dados. Quando os VPC Service Controls estão configurados, o agente implementado mantém o acesso seguro às APIs e aos serviços Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, validando o funcionamento perfeito no seu perímetro definido. Fundamentalmente, os VPC Service Controls bloqueiam eficazmente todo o acesso público à Internet, limitando o movimento de dados aos limites da sua rede autorizada e melhorando significativamente a sua postura de segurança empresarial.

  • Residência dos dados (DRZ): o Vertex AI Agent Engine suporta a residência dos dados (DRZ) para garantir que todos os dados em repouso são armazenados na região especificada.

  • Interface do Private Service Connect: PSC-I permite que os seus agentes interajam com serviços alojados de forma privada na VPC do utilizador. Para mais informações, consulte o artigo Usar a interface do Private Service Connect com o Vertex AI Agent Engine.

  • HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine suporta cargas de trabalho da HIPAA.

Regiões suportadas

O Vertex AI Agent Engine e as sessões do Agent Engine são suportados nas seguintes regiões:

Região Localização Versões suportadas
us-central1 Iowa v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
us-east4 Virgínia do Norte v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
us-west1 Oregon v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west1 Bélgica v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west2 Londres v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west3 Frankfurt v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west4 Países Baixos v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-southwest1 Madrid v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-east1 Taiwan v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-northeast1 Tóquio v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-south1 Mumbai v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-southeast1 Singapura v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
australia-southeast2 Melbourne v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.

Para o Agent Engine Memory Bank (pré-visualização), as seguintes regiões são suportadas:

Região Localização Versões suportadas
us-central1 Iowa A versão v1beta1 é suportada.
us-east4 Virgínia do Norte A versão v1beta1 é suportada.
us-west1 Oregon A versão v1beta1 é suportada.
europe-west1 Bélgica A versão v1beta1 é suportada.
europe-west4 Países Baixos A versão v1beta1 é suportada.
europe-southwest1 Madrid A versão v1beta1 é suportada.

Para a execução de código do motor do agente (pré-visualização), as seguintes regiões são suportadas.

Região Localização Versões suportadas
us-central1 Iowa A versão v1beta1 é suportada.

Quota

Os seguintes limites aplicam-se ao Vertex AI Agent Engine para um determinado projeto em cada região:
Descrição Limite
Criar, eliminar ou atualizar o Vertex AI Agent Engine por minuto 10
Criar, eliminar ou atualizar sessões do Vertex AI Agent Engine por minuto 100
Query ou StreamQuery Vertex AI Agent Engine por minuto 90
Anexe um evento às sessões do Vertex AI Agent Engine por minuto 300
Número máximo de recursos do Vertex AI Agent Engine 100
Criar, eliminar ou atualizar recursos de memória do Vertex AI Agent Engine por minuto 100
Obtenha, liste ou recupere do banco de memória do Vertex AI Agent Engine por minuto 300
Ambiente de sandbox (execução de código) executar pedidos por minuto 1000
Entidades do ambiente de sandbox (execução de código) por região 1000
Um agente A2A publica pedidos como sendMessage e cancelTask por minuto 60
O agente A2A recebe pedidos como getTask e getCard por minuto 600
Ligações bidirecionais em direto simultâneas com a API BidiStreamQuery por minuto 10

Preços

O preço do Agent Engine Runtime baseia-se no cálculo (horas de vCPU) e na memória (horas de GiB) que o seu agente usa para processar pedidos. Não é cobrado qualquer valor pelo tempo em que um agente implementado está inativo.

Produto ID do SKU Preço
vCPU do ReasoningEngine 8A55-0B95-B7DC 0,0994 $/vCPU-Hr
ReasoningEngine Memory 0B45-6103-6EC1 0,0105 $/GiB-hora

Para mais informações, consulte os preços.

Migração para o SDK baseado no cliente

O módulo agent_engines no SDK Vertex AI para Python está a ser refatorado para um design baseado no cliente pelos seguintes motivos principais:

  • Para se alinhar com o ADK da Google e o SDK de IA gen da Google em representações de tipos canónicos. Isto garante uma forma consistente e padronizada de representar os tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz os custos gerais de conversão.
  • Para o âmbito ao nível do cliente de Google Cloud parâmetros em aplicações com vários projetos e várias localizações. Isto permite que uma aplicação faça a gestão das interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as respetivas definições de projeto e localização.
  • Para melhorar a capacidade de deteção e a coesão dos serviços do Vertex AI Agent Engine

O que se segue?