Last reviewed 2025-09-22 UTC
A seguir, uma lista de arquiteturas de referência para implantar um aplicativo de IA generativa com geração aumentada de recuperação (RAG) em Google Cloud.
Arquitetura de referência | Descrição |
---|---|
Infraestrutura de RAG para IA generativa usando o Google Agentspace e a Vertex AI | Uma arquitetura orientada por agentes que usa o Google Agentspace como uma plataforma unificada para orquestrar um fluxo de dados RAG completo para aplicativos empresariais que exigem disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
Infraestrutura de RAG para IA generativa usando a Vertex AI e a Vector Search. | Uma arquitetura sem servidor totalmente gerenciada que oferece pesquisa vetorial otimizada e de alta performance para aplicativos em grande escala. |
Infraestrutura de RAG para IA generativa usando a Vertex AI e o AlloyDB para PostgreSQL. | Uma arquitetura de banco de dados totalmente gerenciada que armazena incorporações de vetores junto com seus dados operacionais em um banco de dados totalmente gerenciado, como Cloud SQL ou AlloyDB para PostgreSQL. |
Infraestrutura de RAG para IA generativa usando o GKE e o Cloud SQL | Uma arquitetura flexível baseada em contêineres que oferece controle máximo para criar aplicativos personalizados com ferramentas de código aberto, como Ray, Hugging Face e LangChain. |
Infraestrutura do GraphRAG para IA generativa usando a Vertex AI e o Spanner Graph | Uma arquitetura avançada de RAG que combina a pesquisa vetorial com consultas do Mapa de Informações para recuperar dados interconectados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes. |