Basamento delle risposte utilizzando la RAG

La fondatezza è una tecnica che puoi utilizzare per produrre risposte del modello più affidabili, utili e oggettive. Quando esegui il grounding delle risposte del modello di AI generativa, le colleghi a fonti di informazione verificabili. Per implementare il grounding, in genere devi recuperare i dati di origine pertinenti. La best practice consigliata è utilizzare la tecnica di generazione RAG (Retrieval-Augmented Generation). Il recupero viene solitamente eseguito utilizzando un motore di ricerca, che utilizza un indice incorporato con i significati semantici del testo di origine.

Esistono anche servizi e API dei componenti che implementano il ciclo di vita di RAG, come l'API Vertex AI Search Builder, che consente la creazione combinata. Con la creazione combinata, puoi implementare una soluzione RAG utilizzando uno dei seguenti servizi o API:

  • API per la generazione di grounding: puoi utilizzarla per implementare il grounding o collegarla a un fornitore di recupero per l'intero ciclo di vita di RAG.
  • Parser del layout del documento: questo parser rappresenta il meglio di Document AI e Gemini per la comprensione dei documenti. Per ulteriori informazioni sul parser del layout, vedi Utilizzare il parser del layout.
  • Vertex AI Vector Search: questo servizio di ricerca è altamente performante e utilizza un database vettoriale di alta qualità.
  • API Check Grounding: questa API confronta l'output RAG con i fatti recuperati e contribuisce a garantire che tutte le affermazioni siano basate su fatti prima di restituire la risposta all'utente.

Basare le risposte utilizzando Vertex AI RAG Engine

Per eseguire il grounding delle risposte utilizzando il motore RAG di Vertex AI, devi creare un prompt. Segui questi passaggi:

  1. Nella console Google Cloud , vai alla pagina Crea prompt utilizzando Vertex AI Studio.

    Vai a Crea prompt

  2. Seleziona Grounding: i tuoi dati.

  3. Seleziona l'origine di grounding RAG Engine.

  4. Nell'elenco Corpus, seleziona il nome del corpus.

  5. Nel campo Similarità Top-K, seleziona 20, che è il valore predefinito.

  6. Fai clic su Salva.

Passaggi successivi