O Vertex AI Agent Engine (anteriormente conhecido como LangChain na Vertex AI ou Vertex AI Reasoning Engine) é um serviço Google Cloud totalmente gerenciado que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA na produção. O Agente Engine processa a infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos inteligentes e eficazes. O Vertex AI Agent Engine oferece:
Totalmente gerenciado: implante e dimensione agentes com um ambiente de execução gerenciado que oferece recursos de segurança robustos, incluindo conformidade com o VPC-SC e recursos abrangentes de gerenciamento de ponta a ponta. Ganhe acesso CRUD a aplicativos multiagente que usam o Google Cloud Trace (com suporte ao OpenTelemetry) para monitoramento de desempenho e rastreamento. Para saber mais, consulte implantar um agente.
Qualidade e avaliação: garanta a qualidade do agente com o serviço integrado de avaliação rápida da Vertex AI.
Desenvolvimento simplificado: o mecanismo de agente abstrai tarefas de baixo nível, como desenvolvimento de servidor de aplicativos e configuração de autenticação e IAM, permitindo que você se concentre nos recursos exclusivos do agente, como comportamento, ferramentas e parâmetros de modelo. Além disso, seus agentes podem usar qualquer um dos modelos e ferramentas, como a chamada de função, na Vertex AI.
Independência de framework: tenha flexibilidade ao implantar agentes que você cria usando diferentes frameworks do Python, incluindo LangGraph, Langchain, AG2 e CrewAI. Se você já tiver um agente, poderá adaptá-lo para execução no Agente Engine usando o modelo personalizado no nosso SDK. Caso contrário, você pode desenvolver um agente do zero usando um dos modelos específicos do framework que oferecemos.
Casos de uso
Para saber mais sobre o mecanismo de agente com exemplos completos, consulte os seguintes recursos:
Criar e implantar no Agente Engine
Observação:para uma experiência de desenvolvimento e implantação simplificada baseada em IDE com o Agent Engine, considere o agent-starter-pack. Ele oferece modelos prontos para uso, uma interface integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a observabilidade.
O fluxo de trabalho para criar um agente no Agent Engine é o seguinte:
Etapas | Descrição |
---|---|
1. configurar o ambiente | Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python. |
2. Desenvolver um agente | Desenvolva um agente que possa ser implantado no Agent Engine. |
3. Implantar o agente | Implante o agente no ambiente de execução gerenciado do Agente Engine. |
4. Usar o agente | Faça uma consulta ao agente enviando uma solicitação de API. |
5. Gerenciar o agente implantado | Gerencie e exclua agentes implantados no Agente Engine. |
As etapas estão ilustradas no diagrama a seguir:
Segurança corporativa
O mecanismo do agente oferece suporte aos VPC Service Controls para fortalecer a segurança dos dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, garantindo a operação perfeita no perímetro definido. Os VPC Service Controls bloqueiam todo o acesso público à Internet, confinando o movimento de dados aos limites autorizados da rede e melhorando significativamente a postura de segurança da empresa.
Preços
Os preços são baseados nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no runtime gerenciado do Agente Engine.
Produto | ID da SKU | Preço |
---|---|---|
vCPU do ReasoningEngine | 8A55-0B95-B7DC | US$ 0,0994/vCPU-hr |
Memória do ReasoningEngine | 0B45-6103-6EC1 | US$ 0,0105/GiB-h |
Para saber mais informações, consulte Preços.