O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos programadores implementar, gerir e dimensionar agentes de IA em produção. O Agent Engine processa a infraestrutura para dimensionar agentes em produção, para que possa concentrar-se na criação de aplicações. O Vertex AI Agent Engine oferece os seguintes serviços que pode usar individualmente ou em combinação:
Tempo de execução:
- Implemente e dimensione agentes com um tempo de execução gerido e capacidades de gestão abrangentes.
- Personalize a imagem do contentor do agente com scripts de instalação no momento da compilação para dependências do sistema.
- Use funcionalidades de segurança, incluindo a conformidade com o VPC-SC e a configuração da autenticação e da IAM.
- Aceda a modelos e ferramentas, como a chamada de funções.
- Implemente agentes criados com diferentes frameworks Python e o protocolo aberto Agent2Agent.
- Compreenda o comportamento dos agentes com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
Qualidade e avaliação (pré-visualização): avalie a qualidade do agente com o serviço de avaliação de IA gen integrado e otimize os agentes com execuções de preparação do modelo Gemini.
Exemplo de loja (pré-visualização): armazene e obtenha dinamicamente exemplos de poucos disparos para melhorar o desempenho do agente.
Sessões (pré-visualização): as sessões do motor de agentes permitem-lhe armazenar interações individuais entre utilizadores e agentes, fornecendo fontes definitivas para o contexto da conversa.
Memory Bank (pré-visualização): o Memory Bank do Agent Engine permite-lhe armazenar e obter informações das sessões para personalizar as interações do agente.
Execução de código (Pré-visualização): a execução de código do motor do agente permite que o seu agente execute código num ambiente de área de testes seguro, isolado e gerido.
O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de funcionalidades para descobrir, criar e implementar agentes de IA.
Crie e implemente no Vertex AI Agent Engine
Nota: para uma experiência de desenvolvimento e implementação simplificada baseada no IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Oferece modelos prontos a usar, uma IU incorporada para experimentação e simplifica a implementação, as operações, a avaliação, a personalização e a observabilidade.
O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:
Passos | Descrição |
---|---|
1. Configure o ambiente | Configure o seu projeto Google e instale a versão mais recente do SDK Vertex AI para Python. |
2. Desenvolva um agente | Desenvolva um agente que possa ser implementado no Vertex AI Agent Engine. |
3. Implemente o agente | Implemente o agente no tempo de execução gerido do Vertex AI Agent Engine. |
4. Use o agente | Consultar o agente enviando um pedido de API. |
5. Faça a gestão do agente implementado | Gerir e eliminar agentes que implementou no Vertex AI Agent Engine. |
Os passos são ilustrados no diagrama seguinte:
Frameworks suportados
A tabela seguinte descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias frameworks de agentes:
Nível de apoio técnico | Frameworks de agentes |
---|---|
Modelo personalizado: pode adaptar um modelo personalizado para suportar a implementação no Vertex AI Agent Engine a partir da sua framework. | CrewAI, estruturas personalizadas |
Integração do SDK Vertex AI: o Vertex AI Agent Engine fornece modelos geridos por framework no SDK Vertex AI e na documentação. | AG2, LlamaIndex |
Integração total: as funcionalidades estão integradas para funcionar na estrutura, no Vertex AI Agent Engine e no Google Cloud ecossistema mais amplo. | Agent Development Kit (ADK), LangChain, LangGraph |
Implemente na produção com o Agent Starter Pack
O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O Agent Starter Pack oferece o seguinte:
- Modelos de agentes pré-criados: ReAct, RAG, multiagente e outros modelos.
- Playground interativo: teste e interaja com o seu agente.
- Infraestrutura automatizada: usa o Terraform para uma gestão de recursos simplificada.
- Pipelines de CI/CD: fluxos de trabalho de implementação automatizados que tiram partido do Cloud Build.
- Observabilidade: apoio técnico integrado para o Cloud Trace e o Cloud Logging.
Para começar, consulte o Início rápido.
Exemplos de utilização
Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:
Exemplo de utilização | Descrição | Links |
---|---|---|
Crie agentes estabelecendo ligação a APIs públicas | Fazer conversões entre moedas. Crie uma função que se ligue a uma app de câmbio de moeda, permitindo que o modelo forneça respostas precisas a consultas como "Qual é a taxa de câmbio de euros para dólares hoje?" |
Notebook do SDK Vertex AI para Python: introdução à criação e implementação de um agente com o Vertex AI Agent Engine |
Conceber um projeto de energia solar comunitária. Identifique potenciais localizações, procure fornecedores e organismos governamentais relevantes e reveja imagens de satélite e o potencial solar de regiões e edifícios para encontrar a localização ideal para instalar os seus painéis solares. |
Notebook do SDK Vertex AI para Python: criar e implementar um agente da API Google Maps com o Vertex AI Agent Engine | |
Crie agentes associando-os a bases de dados | Integração com o AlloyDB e o Cloud SQL para PostgreSQL. | Publicação no blogue: anúncio do LangChain no Vertex AI para o AlloyDB e o Cloud SQL para PostgreSQL Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine |
Crie agentes com ferramentas que acedem aos dados na sua base de dados. | Notebook do SDK Vertex AI para Python: implementação de um agente com o Vertex AI Agent Engine e o MCP Toolbox for Databases | |
Consultar e compreender repositórios de dados estruturados através de linguagem natural. | Bloco de notas do SDK Vertex AI para Python: criar um agente de pesquisa conversacional com o Vertex AI Agent Engine e a RAG na Vertex AI Search | |
Consultar e compreender bases de dados de grafos através da linguagem natural | Publicação no blogue: IA gen GraphRAG e agentes de IA com o Vertex AI Agent Engine com LangChain e Neo4j | |
Consultar e compreender bases de dados vetoriais através da linguagem natural | Publicação no blogue: simplifique a RAG de IA gen com o MongoDB Atlas e o Vertex AI Agent Engine | |
Crie agentes com o Agent Development Kit | Crie e implemente agentes com o Agent Development Kit. | Agent Development Kit – Implementação no Vertex AI Agent Engine |
Faça a gestão do contexto com as sessões do Vertex AI Agent Engine e o banco de memória no modo expresso do Vertex AI sem faturação. | Agent Development Kit: sessões do Vertex AI Agent Engine e banco de memória no modo expresso do Vertex AI. | |
Crie agentes com frameworks de software de código aberto | Crie e implemente agentes com a framework de código aberto OneTwo. | Publicação no blogue - OneTwo e Vertex AI Agent Engine: explorar o desenvolvimento avançado de agentes de IA na Google Cloud |
Crie e implemente agentes através da framework de código aberto LangGraph. | Notebook do SDK Vertex AI para Python: criar e implementar uma aplicação LangGraph com o Vertex AI Agent Engine | |
Depurar e otimizar agentes | Crie e rastreie agentes com o OpenTelemetry e o Cloud Trace. | Vertex AI SDK for Python notebook - Debugging and Optimizing Agents: A Guide to Tracing in Vertex AI Agent Engine |
Crie sistemas multiagentes com o protocolo A2A (pré-visualização) | Crie agentes interoperáveis que comunicam e colaboram com outros agentes, independentemente da respetiva estrutura. | Para mais informações, consulte a documentação do protocolo A2A. |
Segurança empresarial
O Vertex AI Agent Engine suporta várias funcionalidades para ajudar a cumprir os requisitos de segurança empresariais, a seguir as políticas de segurança da sua organização e a seguir as práticas recomendadas de segurança. As seguintes funcionalidades são suportadas:
Chaves de encriptação geridas pelo cliente (CMEK): o Vertex AI Agent Engine suporta CMEK para proteger os seus dados com as suas próprias chaves de encriptação, o que lhe dá a propriedade e o controlo total das chaves que protegem os seus dados em repouso no Google Cloud. Para mais informações, consulte o artigo CMEK do Agent Engine.
VPC Service Controls: o Vertex AI Agent Engine suporta os VPC Service Controls para reforçar a segurança dos dados e mitigar os riscos de exfiltração de dados. Quando os VPC Service Controls estão configurados, o agente implementado mantém o acesso seguro às APIs e aos serviços Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, validando o funcionamento perfeito no seu perímetro definido. Fundamentalmente, os VPC Service Controls bloqueiam eficazmente todo o acesso público à Internet, limitando o movimento de dados aos limites da sua rede autorizada e melhorando significativamente a sua postura de segurança empresarial.
Residência dos dados (DRZ): o Vertex AI Agent Engine suporta a residência dos dados (DRZ) para garantir que todos os dados em repouso são armazenados na região especificada.
Interface do Private Service Connect: PSC-I permite que os seus agentes interajam com serviços alojados de forma privada na VPC do utilizador. Para mais informações, consulte o artigo Usar a interface do Private Service Connect com o Vertex AI Agent Engine.
HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine suporta cargas de trabalho da HIPAA.
Regiões suportadas
O Vertex AI Agent Engine e as sessões do Agent Engine são suportados nas seguintes regiões:
Região | Localização | Versões suportadas |
---|---|---|
us-central1 |
Iowa | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
us-east4 |
Virgínia do Norte | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
us-west1 |
Oregon | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
europe-west1 |
Bélgica | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
europe-west2 |
Londres | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
europe-west3 |
Frankfurt | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
europe-west4 |
Países Baixos | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
europe-southwest1 |
Madrid | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
asia-east1 |
Taiwan | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
asia-northeast1 |
Tóquio | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
asia-south1 |
Mumbai | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
asia-southeast1 |
Singapura | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
australia-southeast2 |
Melbourne | v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização. |
Para o Agent Engine Memory Bank (pré-visualização), as seguintes regiões são suportadas:
Região | Localização | Versões suportadas |
---|---|---|
us-central1 |
Iowa | A versão v1beta1 é suportada. |
us-east4 |
Virgínia do Norte | A versão v1beta1 é suportada. |
us-west1 |
Oregon | A versão v1beta1 é suportada. |
europe-west1 |
Bélgica | A versão v1beta1 é suportada. |
europe-west4 |
Países Baixos | A versão v1beta1 é suportada. |
europe-southwest1 |
Madrid | A versão v1beta1 é suportada. |
Para a execução de código do motor do agente (pré-visualização), as seguintes regiões são suportadas.
Região | Localização | Versões suportadas |
---|---|---|
us-central1 |
Iowa | A versão v1beta1 é suportada. |
Quota
Os seguintes limites aplicam-se ao Vertex AI Agent Engine para um determinado projeto em cada região:Descrição | Limite |
---|---|
Criar, eliminar ou atualizar o Vertex AI Agent Engine por minuto | 10 |
Criar, eliminar ou atualizar sessões do Vertex AI Agent Engine por minuto | 100 |
Query ou StreamQuery Vertex AI Agent Engine por minuto |
90 |
Anexe um evento às sessões do Vertex AI Agent Engine por minuto | 300 |
Número máximo de recursos do Vertex AI Agent Engine | 100 |
Criar, eliminar ou atualizar recursos de memória do Vertex AI Agent Engine por minuto | 100 |
Obtenha, liste ou recupere do banco de memória do Vertex AI Agent Engine por minuto | 300 |
Ambiente de sandbox (execução de código) executar pedidos por minuto | 1000 |
Entidades do ambiente de sandbox (execução de código) por região | 1000 |
Um agente A2A publica pedidos como sendMessage e cancelTask por minuto |
60 |
O agente A2A recebe pedidos como getTask e getCard por minuto |
600 |
Ligações bidirecionais em direto simultâneas com a API BidiStreamQuery por minuto |
10 |
Preços
O preço do Agent Engine Runtime baseia-se no cálculo (horas de vCPU) e na memória (horas de GiB) que o seu agente usa para processar pedidos. Não é cobrado qualquer valor pelo tempo em que um agente implementado está inativo.
Produto | ID do SKU | Preço |
---|---|---|
vCPU do ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-Hr |
ReasoningEngine Memory | 0B45-6103-6EC1 | 0,0105 $/GiB-hora |
Para mais informações, consulte os preços.
Migração para o SDK baseado no cliente
O módulo agent_engines
no SDK Vertex AI para Python está a ser refatorado para um design baseado no cliente pelos seguintes motivos principais:
- Para se alinhar com o ADK da Google e o SDK de IA gen da Google em representações de tipos canónicos. Isto garante uma forma consistente e padronizada de representar os tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz os custos gerais de conversão.
- Para o âmbito ao nível do cliente de Google Cloud parâmetros em aplicações com vários projetos e várias localizações. Isto permite que uma aplicação faça a gestão das interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as respetivas definições de projeto e localização.
- Para melhorar a capacidade de deteção e a coesão dos serviços do Vertex AI Agent Engine