Last reviewed 2025-09-22 UTC
Vous trouverez ci-dessous une liste d'architectures de référence pour déployer une application d'IA générative avec génération augmentée de récupération (RAG) dans Google Cloud.
Architecture de référence | Description |
---|---|
Infrastructure RAG pour l'IA générative à l'aide de Google Agentspace et Vertex AI | Une architecture pilotée par des agents qui utilise Google Agentspace comme plate-forme unifiée pour orchestrer un flux de données RAG de bout en bout pour les applications d'entreprise qui nécessitent une disponibilité des données en temps réel et une recherche contextuelle enrichie. |
Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et Vector Search | Architecture sans serveur entièrement gérée qui fournit une recherche vectorielle optimisée et hautes performances pour les applications à grande échelle. |
Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL. | Architecture de base de données entièrement gérée qui stocke les embeddings vectoriels à côté de vos données opérationnelles dans une base de données entièrement gérée comme Cloud SQL ou AlloyDB pour PostgreSQL. |
Infrastructure RAG pour l'IA générative à l'aide de GKE et Cloud SQL | Une architecture flexible basée sur des conteneurs qui offre un contrôle maximal pour créer des applications personnalisées avec des outils Open Source tels que Ray, Hugging Face et LangChain. |
Infrastructure GraphRAG pour l'IA générative à l'aide de Vertex AI et Spanner Graph | Une architecture RAG avancée qui combine la recherche vectorielle avec des requêtes Knowledge Graph pour récupérer des données contextuelles interconnectées, ce qui permet d'obtenir des réponses d'IA générative plus détaillées et pertinentes. |