Questa pagina è stata tradotta dall'API Cloud Translation.

Panoramica del motore RAG di Vertex AI

Il motore RAG di Vertex AI, un componente della piattaforma Vertex AI, semplifica la generazione RAG (Retrieval-Augmented Generation). Vertex AI RAG Engine è anche un framework di dati per lo sviluppo di applicazioni basate su modelli linguistici di grandi dimensioni (LLM) con aggiunta del contesto. L'aumento del contesto avviene quando applichi un modello LLM ai tuoi dati. È così che viene implementata la generazione RAG (Retrieval-Augmented Generation).

Un problema comune degli LLM è che non comprendono le conoscenze private, ovvero i dati della tua organizzazione. Con Vertex AI RAG Engine, puoi arricchire il contesto dei modelli LLM con informazioni private aggiuntive, perché il modello può ridurre le allucinazioni e rispondere alle domande in modo più preciso.

Combinando fonti di conoscenza aggiuntive con le conoscenze esistenti degli LLM, viene fornito un contesto migliore. Il contesto migliorato insieme alla query migliora la qualità della risposta dell'LLM.

L'immagine seguente illustra i concetti chiave per comprendere il motore RAG di Vertex AI.

Concetti chiave di Vertex AI RAG

Questi concetti sono elencati nell'ordine del processo di generazione RAG (Retrieval-Augmented Generation).

Importazione dei dati: importa i dati da origini dati diverse. Ad esempio, file locali, Cloud Storage e Google Drive.
Trasformazione dei dati: conversione dei dati in preparazione all'indicizzazione. Ad esempio, i dati vengono suddivisi in blocchi.
Incorporamento: rappresentazioni numeriche di parole o parti di testo. Questi numeri riflettono il significato semantico e il contesto del testo. Parole o testo simili o correlati tendono ad avere incorporamenti simili, il che significa che sono più vicini nello spazio vettoriale di alta dimensione.
Indicizzazione dei dati: il motore RAG di Vertex AI crea un indice chiamato corpus. L'indice struttura la knowledge base in modo che sia ottimizzata per la ricerca. Ad esempio, l'indice è come un sommario dettagliato di un grande libro di riferimento.
Ricerca: quando un utente pone una domanda o fornisce un prompt, il componente di recupero nel motore RAG di Vertex AI esegue ricerche nella knowledge base per trovare informazioni pertinenti alla query.
Genesi: le informazioni recuperate diventano il contesto aggiunto alla query dell'utente originale come guida per il modello di AI generativa per generare risposte pertinenti e basate su fatti.

Aree geografiche supportate

Vertex AI RAG Engine è supportato nelle seguenti regioni:

Regione	Località	Descrizione	Fase di avvio
`europe-west3`	Francoforte, Germania	Sono supportate le versioni `v1` e `v1beta1`.	GA
`us-central1`	Iowa	Sono supportate le versioni `v1` e `v1beta1`.	GA

Passaggi successivi

Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività del motore RAG di Vertex AI, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la Panoramica del grounding.
Per scoprire le differenze tra RAG e grounding, consulta Eseguire il grounding delle risposte utilizzando RAG.
Per scoprire di più sull'architettura RAG:
- Infrastruttura per un'applicazione di AI generativa compatibile con RAG che utilizza Vertex AI e Vector Search
- Infrastruttura per un'applicazione di IA generativa compatibile con RAG che utilizza Vertex AI e AlloyDB per PostgreSQL.