A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estão disponíveis em projetos que não tenham usado estes modelos anteriormente, incluindo novos projetos. Para ver detalhes, consulte o artigo Versões e ciclo de vida dos modelos.

Esta página foi traduzida pela API Cloud Translation.

Vista geral do Vertex AI Agent Engine

O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos programadores implementar, gerir e dimensionar agentes de IA em produção. O Agent Engine processa a infraestrutura para dimensionar agentes em produção, para que possa concentrar-se na criação de aplicações. O Vertex AI Agent Engine oferece os seguintes serviços que pode usar individualmente ou em combinação:

Tempo de execução:
- Implemente e dimensione agentes com um tempo de execução gerido e capacidades de gestão abrangentes.
- Personalize a imagem do contentor do agente com scripts de instalação no momento da compilação para dependências do sistema.
- Use funcionalidades de segurança, incluindo a conformidade com o VPC-SC e a configuração da autenticação e da IAM.
- Aceda a modelos e ferramentas, como a chamada de funções.
- Implemente agentes criados com diferentes frameworks Python e o protocolo aberto Agent2Agent.
- Compreenda o comportamento dos agentes com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
Qualidade e avaliação (pré-visualização): avalie a qualidade do agente com o serviço de avaliação de IA gen integrado e otimize os agentes com execuções de preparação do modelo Gemini.
Exemplo de loja (pré-visualização): armazene e obtenha dinamicamente exemplos de poucos disparos para melhorar o desempenho do agente.
Sessões (pré-visualização): as sessões do motor de agentes permitem-lhe armazenar interações individuais entre utilizadores e agentes, fornecendo fontes definitivas para o contexto da conversa.
Memory Bank (pré-visualização): o Memory Bank do Agent Engine permite-lhe armazenar e obter informações das sessões para personalizar as interações do agente.
Execução de código (Pré-visualização): a execução de código do motor do agente permite que o seu agente execute código num ambiente de área de testes seguro, isolado e gerido.

Vista geral conceptual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de funcionalidades para descobrir, criar e implementar agentes de IA.

Crie e implemente no Vertex AI Agent Engine

Nota: para uma experiência de desenvolvimento e implementação simplificada baseada no IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Oferece modelos prontos a usar, uma IU incorporada para experimentação e simplifica a implementação, as operações, a avaliação, a personalização e a observabilidade.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:

Passos	Descrição
1. Configure o ambiente	Configure o seu projeto Google e instale a versão mais recente do SDK Vertex AI para Python.
2. Desenvolva um agente	Desenvolva um agente que possa ser implementado no Vertex AI Agent Engine.
3. Implemente o agente	Implemente o agente no tempo de execução gerido do Vertex AI Agent Engine.
4. Use o agente	Consultar o agente enviando um pedido de API.
5. Faça a gestão do agente implementado	Gerir e eliminar agentes que implementou no Vertex AI Agent Engine.

Os passos são ilustrados no diagrama seguinte:

Crie e implemente um agente

Frameworks suportados

A tabela seguinte descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias frameworks de agentes:

Nível de apoio técnico	Frameworks de agentes
Modelo personalizado: pode adaptar um modelo personalizado para suportar a implementação no Vertex AI Agent Engine a partir da sua framework.	CrewAI, estruturas personalizadas
Integração do SDK Vertex AI: o Vertex AI Agent Engine fornece modelos geridos por framework no SDK Vertex AI e na documentação.	AG2, LlamaIndex
Integração total: as funcionalidades estão integradas para funcionar na estrutura, no Vertex AI Agent Engine e no Google Cloud ecossistema mais amplo.	Agent Development Kit (ADK), LangChain, LangGraph

Implemente na produção com o Agent Starter Pack

O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O Agent Starter Pack oferece o seguinte:

Modelos de agentes pré-criados: ReAct, RAG, multiagente e outros modelos.
Playground interativo: teste e interaja com o seu agente.
Infraestrutura automatizada: usa o Terraform para uma gestão de recursos simplificada.
Pipelines de CI/CD: fluxos de trabalho de implementação automatizados que tiram partido do Cloud Build.
Observabilidade: apoio técnico integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Início rápido.

Exemplos de utilização

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Exemplo de utilização	Descrição	Links
Crie agentes estabelecendo ligação a APIs públicas	Fazer conversões entre moedas. Crie uma função que se ligue a uma app de câmbio de moeda, permitindo que o modelo forneça respostas precisas a consultas como "Qual é a taxa de câmbio de euros para dólares hoje?"	Notebook do SDK Vertex AI para Python: introdução à criação e implementação de um agente com o Vertex AI Agent Engine
Crie agentes estabelecendo ligação a APIs públicas	Conceber um projeto de energia solar comunitária. Identifique potenciais localizações, procure fornecedores e organismos governamentais relevantes e reveja imagens de satélite e o potencial solar de regiões e edifícios para encontrar a localização ideal para instalar os seus painéis solares.	Notebook do SDK Vertex AI para Python: criar e implementar um agente da API Google Maps com o Vertex AI Agent Engine
Crie agentes associando-os a bases de dados	Integração com o AlloyDB e o Cloud SQL para PostgreSQL.	Publicação no blogue: anúncio do LangChain no Vertex AI para o AlloyDB e o Cloud SQL para PostgreSQL Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
	Crie agentes com ferramentas que acedem aos dados na sua base de dados.	Notebook do SDK Vertex AI para Python: implementação de um agente com o Vertex AI Agent Engine e o MCP Toolbox for Databases
	Consultar e compreender repositórios de dados estruturados através de linguagem natural.	Bloco de notas do SDK Vertex AI para Python: criar um agente de pesquisa conversacional com o Vertex AI Agent Engine e a RAG na Vertex AI Search
	Consultar e compreender bases de dados de grafos através da linguagem natural	Publicação no blogue: IA gen GraphRAG e agentes de IA com o Vertex AI Agent Engine com LangChain e Neo4j
	Consultar e compreender bases de dados vetoriais através da linguagem natural	Publicação no blogue: simplifique a RAG de IA gen com o MongoDB Atlas e o Vertex AI Agent Engine
Crie agentes com o Agent Development Kit	Crie e implemente agentes com o Agent Development Kit.	Agent Development Kit – Implementação no Vertex AI Agent Engine
Crie agentes com o Agent Development Kit	Faça a gestão do contexto com as sessões do Vertex AI Agent Engine e o banco de memória no modo expresso do Vertex AI sem faturação.	Agent Development Kit: sessões do Vertex AI Agent Engine e banco de memória no modo expresso do Vertex AI.
Crie agentes com frameworks de software de código aberto	Crie e implemente agentes com a framework de código aberto OneTwo.	Publicação no blogue - OneTwo e Vertex AI Agent Engine: explorar o desenvolvimento avançado de agentes de IA na Google Cloud
Crie agentes com frameworks de software de código aberto	Crie e implemente agentes através da framework de código aberto LangGraph.	Notebook do SDK Vertex AI para Python: criar e implementar uma aplicação LangGraph com o Vertex AI Agent Engine
Depurar e otimizar agentes	Crie e rastreie agentes com o OpenTelemetry e o Cloud Trace.	Vertex AI SDK for Python notebook - Debugging and Optimizing Agents: A Guide to Tracing in Vertex AI Agent Engine
Crie sistemas multiagentes com o protocolo A2A (pré-visualização)	Crie agentes interoperáveis que comunicam e colaboram com outros agentes, independentemente da respetiva estrutura.	Para mais informações, consulte a documentação do protocolo A2A.

Segurança empresarial

O Vertex AI Agent Engine suporta várias funcionalidades para ajudar a cumprir os requisitos de segurança empresariais, a seguir as políticas de segurança da sua organização e a seguir as práticas recomendadas de segurança. As seguintes funcionalidades são suportadas:

Chaves de encriptação geridas pelo cliente (CMEK): o Vertex AI Agent Engine suporta CMEK para proteger os seus dados com as suas próprias chaves de encriptação, o que lhe dá a propriedade e o controlo total das chaves que protegem os seus dados em repouso no Google Cloud. Para mais informações, consulte o artigo CMEK do Agent Engine.
VPC Service Controls: o Vertex AI Agent Engine suporta os VPC Service Controls para reforçar a segurança dos dados e mitigar os riscos de exfiltração de dados. Quando os VPC Service Controls estão configurados, o agente implementado mantém o acesso seguro às APIs e aos serviços Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, validando o funcionamento perfeito no seu perímetro definido. Fundamentalmente, os VPC Service Controls bloqueiam eficazmente todo o acesso público à Internet, limitando o movimento de dados aos limites da sua rede autorizada e melhorando significativamente a sua postura de segurança empresarial.

Nota: se usar o Vertex AI Agent Engine num ambiente VPC-SC, tem de criar uma regra de entrada no seu perímetro para permitir a entrada do agente do serviço Reasoning Engine (service-PROJECT_NUMBER@gcp-sa-aiplatform-re.iam.gserviceaccount.com) para o serviço storage.googleapis.com e o serviço artifactregistry.googleapis.com.
Residência dos dados (DRZ): o Vertex AI Agent Engine suporta a residência dos dados (DRZ) para garantir que todos os dados em repouso são armazenados na região especificada.
Interface do Private Service Connect: PSC-I permite que os seus agentes interajam com serviços alojados de forma privada na VPC do utilizador. Para mais informações, consulte o artigo Usar a interface do Private Service Connect com o Vertex AI Agent Engine.
HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine suporta cargas de trabalho da HIPAA.

Regiões suportadas

O Vertex AI Agent Engine e as sessões do Agent Engine são suportados nas seguintes regiões:

Região	Localização	Versões suportadas
`us-central1`	Iowa	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`us-east4`	Virgínia do Norte	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`us-west1`	Oregon	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`europe-west1`	Bélgica	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`europe-west2`	Londres	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`europe-west3`	Frankfurt	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`europe-west4`	Países Baixos	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`europe-southwest1`	Madrid	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`asia-east1`	Taiwan	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`asia-northeast1`	Tóquio	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`asia-south1`	Mumbai	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`asia-southeast1`	Singapura	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.
`australia-southeast2`	Melbourne	`v1` é suportado para funcionalidades da DG. O `v1beta1` é suportado para funcionalidades de pré-visualização.

Para o Agent Engine Memory Bank (pré-visualização), as seguintes regiões são suportadas:

Região	Localização	Versões suportadas
`us-central1`	Iowa	A versão `v1beta1` é suportada.
`us-east4`	Virgínia do Norte	A versão `v1beta1` é suportada.
`us-west1`	Oregon	A versão `v1beta1` é suportada.
`europe-west1`	Bélgica	A versão `v1beta1` é suportada.
`europe-west4`	Países Baixos	A versão `v1beta1` é suportada.
`europe-southwest1`	Madrid	A versão `v1beta1` é suportada.

Para a execução de código do motor do agente (pré-visualização), as seguintes regiões são suportadas.

Região	Localização	Versões suportadas
`us-central1`	Iowa	A versão `v1beta1` é suportada.

Quota

Os seguintes limites aplicam-se ao Vertex AI Agent Engine para um determinado projeto em cada região:

Descrição	Limite
Criar, eliminar ou atualizar o Vertex AI Agent Engine por minuto	10
Criar, eliminar ou atualizar sessões do Vertex AI Agent Engine por minuto	100
`Query` ou `StreamQuery` Vertex AI Agent Engine por minuto	90
Anexe um evento às sessões do Vertex AI Agent Engine por minuto	300
Número máximo de recursos do Vertex AI Agent Engine	100
Criar, eliminar ou atualizar recursos de memória do Vertex AI Agent Engine por minuto	100
Obtenha, liste ou recupere do banco de memória do Vertex AI Agent Engine por minuto	300
Ambiente de sandbox (execução de código) executar pedidos por minuto	1000
Entidades do ambiente de sandbox (execução de código) por região	1000
Um agente A2A publica pedidos como `sendMessage` e `cancelTask` por minuto	60
O agente A2A recebe pedidos como `getTask` e `getCard` por minuto	600
Ligações bidirecionais em direto simultâneas com a API `BidiStreamQuery` por minuto	10

Preços

O preço do Agent Engine Runtime baseia-se no cálculo (horas de vCPU) e na memória (horas de GiB) que o seu agente usa para processar pedidos. Não é cobrado qualquer valor pelo tempo em que um agente implementado está inativo.

Produto	ID do SKU	Preço
vCPU do ReasoningEngine	8A55-0B95-B7DC	0,0994 $/vCPU-Hr
ReasoningEngine Memory	0B45-6103-6EC1	0,0105 $/GiB-hora

Para mais informações, consulte os preços.

Migração para o SDK baseado no cliente

O módulo agent_engines no SDK Vertex AI para Python está a ser refatorado para um design baseado no cliente pelos seguintes motivos principais:

Para se alinhar com o ADK da Google e o SDK de IA gen da Google em representações de tipos canónicos. Isto garante uma forma consistente e padronizada de representar os tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz os custos gerais de conversão.
Para o âmbito ao nível do cliente de Google Cloud parâmetros em aplicações com vários projetos e várias localizações. Isto permite que uma aplicação faça a gestão das interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as respetivas definições de projeto e localização.
Para melhorar a capacidade de deteção e a coesão dos serviços do Vertex AI Agent Engine