Last reviewed 2025-09-22 UTC
Segue-se uma lista de arquiteturas de referência para implementar uma aplicação de IA generativa com geração aumentada de recuperação (RAG) no Google Cloud.
Arquitetura de referência | Descrição |
---|---|
Infraestrutura de RAG para IA generativa com o Google Agentspace e o Vertex AI | Uma arquitetura orientada por agentes que usa o Google Agentspace como uma plataforma unificada para orquestrar um fluxo de dados RAG completo para aplicações empresariais que requerem disponibilidade de dados em tempo real e pesquisa contextual enriquecida. |
Infraestrutura RAG para IA generativa com a Vertex AI e a pesquisa vetorial. | Uma arquitetura sem servidor totalmente gerida que oferece uma pesquisa vetorial otimizada e de alto desempenho para aplicações de grande escala. |
Infraestrutura de RAG para IA generativa com o Vertex AI e o AlloyDB para PostgreSQL. | Uma arquitetura de base de dados totalmente gerida que armazena incorporações de vetores juntamente com os seus dados operacionais numa base de dados totalmente gerida, como o Cloud SQL ou o AlloyDB para PostgreSQL. |
Infraestrutura de RAG para IA generativa com o GKE e o Cloud SQL | Uma arquitetura flexível baseada em contentores que oferece o máximo de controlo para criar aplicações personalizadas com ferramentas de código aberto, como Ray, Hugging Face e LangChain. |
Infraestrutura GraphRAG para IA generativa com o Vertex AI e o Spanner Graph | Uma arquitetura RAG avançada que combina a pesquisa vetorial com consultas de grafos de conhecimento para obter dados interligados e contextuais, o que resulta em respostas de IA generativa mais detalhadas e relevantes. |