Infrastruttura RAG per applicazioni di AI generativa in Google Cloud

Last reviewed 2025-09-22 UTC

Di seguito è riportato un elenco di architetture di riferimento per il deployment di un'applicazione di AI generativa con Retrieval-Augmented Generation (RAG) in Google Cloud.

Architettura di riferimento Descrizione
Infrastruttura RAG per l'AI generativa utilizzando Google Agentspace e Vertex AI Un'architettura basata su agenti che utilizza Google Agentspace come piattaforma unificata per orchestrare un flusso di dati RAG end-to-end per applicazioni aziendali che richiedono la disponibilità di dati in tempo reale e una ricerca contestuale arricchita.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e Vector Search. Un'architettura serverless completamente gestita che fornisce una ricerca vettoriale ottimizzata e ad alte prestazioni per applicazioni su larga scala.
Infrastruttura RAG per l'AI generativa utilizzando Vertex AI e AlloyDB per PostgreSQL. Un'architettura di database completamente gestita che archivia gli incorporamenti vettoriali insieme ai dati operativi in un database completamente gestito come Cloud SQL o AlloyDB per PostgreSQL.
Infrastruttura RAG per l'AI generativa utilizzando GKE e Cloud SQL Un'architettura flessibile basata su container che offre il massimo controllo per creare applicazioni personalizzate con strumenti open source come Ray, Hugging Face e LangChain.
Infrastruttura GraphRAG per l'AI generativa utilizzando Vertex AI e Spanner Graph Un'architettura RAG avanzata che combina la ricerca vettoriale con query del knowledge graph per recuperare dati contestuali interconnessi, il che si traduce in risposte dell'AI generativa più dettagliate e pertinenti.