Last reviewed 2025-09-22 UTC
Di seguito è riportato un elenco di architetture di riferimento per il deployment di un'applicazione di AI generativa con Retrieval-Augmented Generation (RAG) in Google Cloud.
Architettura di riferimento | Descrizione |
---|---|
Infrastruttura RAG per l'AI generativa utilizzando Google Agentspace e Vertex AI | Un'architettura basata su agenti che utilizza Google Agentspace come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e una ricerca contestuale arricchita. |
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e Vector Search. | Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala. |
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e AlloyDB per PostgreSQL. | Un'architettura di database completamente gestita che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come Cloud SQL o AlloyDB per PostgreSQL. |
Infrastruttura RAG per l'AI generativa utilizzando GKE e Cloud SQL | Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain. |
Infrastruttura GraphRAG per l'AI generativa utilizzando Vertex AI e Spanner Graph | Un'architettura RAG avanzata che combina la ricerca vettoriale con query del knowledge graph per recuperare dati contestuali interconnessi, il che si traduce in risposte dell'AI generativa più dettagliate e pertinenti. |