Infraestrutura RAG para aplicações de IA generativa em Google Cloud

Last reviewed 2025-09-22 UTC

Segue-se uma lista de arquiteturas de referência para implementar uma aplicação de IA generativa com geração aumentada de recuperação (RAG) no Google Cloud.

Arquitetura de referência Descrição
Infraestrutura de RAG para IA generativa com o Google Agentspace e o Vertex AI Uma arquitetura orientada por agentes que usa o Google Agentspace como uma plataforma unificada para orquestrar um fluxo de dados RAG completo para aplicações empresariais que requerem disponibilidade de dados em tempo real e pesquisa contextual enriquecida.
Infraestrutura RAG para IA generativa com a Vertex AI e a pesquisa vetorial. Uma arquitetura sem servidor totalmente gerida que oferece uma pesquisa vetorial otimizada e de alto desempenho para aplicações de grande escala.
Infraestrutura de RAG para IA generativa com o Vertex AI e o AlloyDB para PostgreSQL. Uma arquitetura de base de dados totalmente gerida que armazena incorporações de vetores juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o Cloud SQL ou o AlloyDB para PostgreSQL.
Infraestrutura de RAG para IA generativa com o GKE e o Cloud SQL Uma arquitetura flexível baseada em contentores que oferece o máximo de controlo para criar aplicações personalizadas com ferramentas de código aberto, como Ray, Hugging Face e LangChain.
Infraestrutura GraphRAG para IA generativa com o Vertex AI e o Spanner Graph Uma arquitetura RAG avançada que combina a pesquisa vetorial com consultas de grafos de conhecimento para obter dados interligados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes.