Esta página se ha traducido con Cloud Translation API.

Infraestructura de RAG para aplicaciones de IA generativa en Google Cloud

Last reviewed 2025-09-22 UTC

A continuación, se muestra una lista de arquitecturas de referencia para desplegar una aplicación de IA generativa con generación aumentada de recuperación (RAG) en Google Cloud.

Arquitectura de referencia	Descripción
Infraestructura de RAG para IA generativa con Google Agentspace y Vertex AI	Una arquitectura basada en agentes que usa Google Agentspace como plataforma unificada para orquestar un flujo de datos de RAG integral para aplicaciones empresariales que requieren disponibilidad de datos en tiempo real y búsquedas contextuales enriquecidas.
Infraestructura de RAG para IA generativa con Vertex AI y Vector Search.	Una arquitectura sin servidor totalmente gestionada que proporciona una búsqueda de vectores optimizada y de alto rendimiento para aplicaciones a gran escala.
Infraestructura de RAG para IA generativa con Vertex AI y AlloyDB para PostgreSQL.	Una arquitectura de base de datos totalmente gestionada que almacena las inserciones de vectores junto con tus datos operativos en una base de datos totalmente gestionada, como Cloud SQL o AlloyDB para PostgreSQL.
Infraestructura de RAG para IA generativa con GKE y Cloud SQL	Una arquitectura flexible basada en contenedores que proporciona el máximo control para crear aplicaciones personalizadas con herramientas de código abierto como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG para IA generativa con Vertex AI y Spanner Graph	Una arquitectura de RAG avanzada que combina la búsqueda vectorial con consultas de grafos de conocimiento para recuperar datos interconectados y contextuales, lo que da como resultado respuestas de IA generativa más detalladas y relevantes.