Last reviewed 2025-09-22 UTC
A continuación, se incluye una lista de arquitecturas de referencia para implementar una aplicación de IA generativa con generación mejorada por recuperación (RAG) en Google Cloud.
Arquitectura de referencia | Descripción |
---|---|
Infraestructura de RAG para IA generativa con Google Agentspace y Vertex AI | Una arquitectura basada en agentes que usa Google Agentspace como una plataforma unificada para coordinar un flujo de datos de RAG de extremo a extremo para aplicaciones empresariales que requieren disponibilidad de datos en tiempo real y búsqueda contextual enriquecida. |
Infraestructura de RAG para IA generativa con Vertex AI y Vector Search. | Una arquitectura sin servidores completamente administrada que proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala. |
Infraestructura de RAG para IA generativa con Vertex AI y AlloyDB para PostgreSQL. | Una arquitectura de base de datos completamente administrada que almacena incorporaciones de vectores junto con tus datos operativos en una base de datos completamente administrada, como Cloud SQL o AlloyDB para PostgreSQL. |
Infraestructura de RAG para IA generativa con GKE y Cloud SQL | Una arquitectura flexible basada en contenedores que proporciona el máximo control para compilar aplicaciones personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain. |
Infraestructura de GraphRAG para IA generativa con Vertex AI y Spanner Graph | Una arquitectura de RAG avanzada que combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos interconectados y contextuales, lo que genera respuestas más detalladas y pertinentes de la IA generativa. |