Infraestructura de RAG para aplicaciones de IA generativa en Google Cloud

Last reviewed 2025-09-22 UTC

A continuación, se incluye una lista de arquitecturas de referencia para implementar una aplicación de IA generativa con generación mejorada por recuperación (RAG) en Google Cloud.

Arquitectura de referencia Descripción
Infraestructura de RAG para IA generativa con Google Agentspace y Vertex AI Una arquitectura basada en agentes que usa Google Agentspace como una plataforma unificada para coordinar un flujo de datos de RAG de extremo a extremo para aplicaciones empresariales que requieren disponibilidad de datos en tiempo real y búsqueda contextual enriquecida.
Infraestructura de RAG para IA generativa con Vertex AI y Vector Search. Una arquitectura sin servidores completamente administrada que proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala.
Infraestructura de RAG para IA generativa con Vertex AI y AlloyDB para PostgreSQL. Una arquitectura de base de datos completamente administrada que almacena incorporaciones de vectores junto con tus datos operativos en una base de datos completamente administrada, como Cloud SQL o AlloyDB para PostgreSQL.
Infraestructura de RAG para IA generativa con GKE y Cloud SQL Una arquitectura flexible basada en contenedores que proporciona el máximo control para compilar aplicaciones personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG para IA generativa con Vertex AI y Spanner Graph Una arquitectura de RAG avanzada que combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos interconectados y contextuales, lo que genera respuestas más detalladas y pertinentes de la IA generativa.