Use o Cloud Run para hospedar agentes de IA. Os agentes de IA podem ser implementados como serviços do Cloud Run e realizar tarefas e fornecer informações aos usuários de forma interativa. O Cloud Run oferece escalonamento automático e alta capacidade de escalonamento sem provisionar recursos, e só cobra pelo uso real. Os agentes de IA podem ser usados para vários fins, como atendimento ao cliente, assistentes virtuais e geração de conteúdo.
É possível usar um serviço do Cloud Run como um endpoint de API escalonável para processar solicitações de usuários finais. O serviço executa um framework de orquestração de IA, como LangChain, LangGraph ou Firebase Genkit, que orquestra chamadas para:
- Modelos de IA, como a API Gemini, os endpoints da Vertex AI ou outro serviço do Cloud Run com GPU.
- Bancos de dados vetoriais, como o Cloud SQL para PostgreSQL ou o AlloyDB para PostgreSQL com a extensão
pgvector
. - Outros serviços ou APIs.
Para uma arquitetura mais detalhada, consulte Infraestrutura para um aplicativo de IA generativa com capacidade de RAG usando a Vertex AI e o AlloyDB para PostgreSQL.
Saiba como implantar o Firebase Genkit no Cloud Run na documentação do Firebase Genkit.
Aprenda a criar e implantar um app LangChain no Cloud Run em um codelab.