Ricevere snippet e contenuti estratti

Vertex AI Search può fornire snippet di ricerca, risposte estrattive e segmenti estrattivi con ogni risposta di ricerca per migliorare i risultati.

  • Snippet: uno snippet è un breve estratto di testo del documento del risultato di ricerca che fornisce un'anteprima dei contenuti di un risultato di ricerca. Include l'evidenziazione dei risultati che puoi visualizzare nell'interfaccia utente. Gli snippet vengono solitamente visualizzati sotto ogni risultato di ricerca per aiutare gli utenti finali a valutare la pertinenza e l'utilità del risultato. Gli snippet sono disponibili per i data store con dati non strutturati e dati dei siti web (sia per la ricerca di base del sito web sia per l'indicizzazione avanzata del sito web).

  • Risposte estrattive: una risposta estratta è un testo riportato testualmente che viene restituito con ogni risultato di ricerca. Viene estratto direttamente dal documento originale. Le risposte estrattive vengono in genere visualizzate nella parte superiore delle pagine web per fornire all'utente finale una risposta breve pertinente al contesto della sua query. Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

  • Segmenti estratti: un segmento estratto è un testo esatto restituito con ogni risultato di ricerca. Un segmento estratto è in genere più prolisso di una risposta estratta. I segmenti estratti possono essere visualizzati come risposta a una query e possono essere utilizzati per eseguire attività di post-elaborazione e come input per i modelli linguistici di grandi dimensioni per generare risposte o nuovo testo. I segmenti estratti sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Esempi

I seguenti esempi aiutano a illustrare le differenze tra snippet, risposte estrattive e segmenti estrattivi.

Query: "Che cos'è Vertex AI Agent Builder?"

  • Snippet:

    Per abilitare questa funzionalità, annunciamo il nostro nuovo Vertex AI Agent Builder, il modo più rapido per gli sviluppatori di iniziare a creare app di IA generativa come bot, ...

  • Risposta con estrazione:

    Vertex AI Agent Builder consente agli sviluppatori di implementare rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso tramite API ai modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare rapidamente la creazione di app generative in pochi minuti o ore.

  • Segmento estrattivo:

    Anche le aziende e i governi vogliono rendere più efficaci e utili le interazioni con clienti, partner e dipendenti con questa nuova tecnologia AI. Per supportare questa esigenza, stiamo lanciando il nuovo Vertex AI Agent Builder.

    Vertex AI Agent Builder consente agli sviluppatori di implementare rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso tramite API ai modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare rapidamente la creazione di app generative in pochi minuti o ore. Con Vertex AI Agent Builder, gli sviluppatori potranno anche:

    • Combina i dati dell'organizzazione e le tecniche di recupero delle informazioni per fornire risposte pertinenti.
    • Cerca e rispondi con più di un semplice testo.
    • Combina conversazioni naturali con flussi strutturati.
    • Non solo informare: effettua transazioni.

Prima di iniziare

A seconda del tipo di app, completa i seguenti prerequisiti:

Snippet

Gli snippet sono brevi estratti estratti verbatim da ogni documento del risultato di ricerca. Sono inclusi gli elementi di evidenziazione dei risultati in tag HTML in grassetto per il rendering delle anteprime dei risultati di ricerca in un'interfaccia utente. In genere, gli snippet vengono visualizzati come testo di anteprima sotto un risultato di ricerca per aiutare gli utenti finali a decidere se fare clic sul risultato di ricerca sarà utile.

Gli snippet sono disponibili per la ricerca non strutturata e per i siti web.

Visualizza gli snippet

Per ottenere gli snippet:

  1. Invia una richiesta di ricerca che includa ContentSearchSpec.SnippetSpec e imposta returnSnippet su true.

    L'esempio seguente di SnippetSpec specifica che è possibile restituire un snippet per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: se impostato su true, restituisce uno snippet.
  2. Recupera gli snippet dalla risposta della ricerca. Gli snippet vengono restituiti con ogni risultato di ricerca in derivedStructData.snippets.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, il risultato include uno snippet con l'evidenziazione in grassetto della corrispondenza:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: contiene uno snippet generato per il risultato di ricerca del documento. L'evidenziazione degli hit è inclusa nei tag HTML in grassetto.
    • snippet_status: se viene generato uno snippet, questo campo viene restituito come SUCCESS. Se non viene generato alcun snippet, questo campo viene restituito come NO_SNIPPET_AVAILABLE.

Risposte estrattive

Una risposta estratta è una sezione di testo ricavata testualmente da un documento. Quando un documento viene restituito come risultato di ricerca in una risposta alla ricerca, insieme al risultato può essere restituita una risposta estratta pertinente.

Una risposta estratta può essere un testo, ad esempio un paragrafo, una tabella o un elenco puntato, estratto dal documento del risultato di ricerca. Le risposte estrattive sono più brevi dei segmenti estrattivi.

Le risposte estrattive possono essere utilizzate come alternativa alle risposte riassunte nei casi in cui siano preferibili risposte precise e letterali ai riepiloghi riformulati.

Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Ricevere risposte estrattive

Per ottenere risposte estrattive:

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveAnswerCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire una risposta per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: il numero di risposte estrattive da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il massimo è 5.
  2. Ricevi risposte estrattive dalla risposta alla ricerca. Le risposte estrattive vengono riportate con ogni risultato di ricerca in extractive_answers.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è stata inclusa una risposta estratta con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti della risposta estratta.

Segmenti estratti

Un segmento estratto è una sezione di testo estratta letteralmente da un documento del risultato di ricerca. I segmenti estratti sono simili alle risposte estrattive, ma in genere sono più completi e descrittivi. In genere, i segmenti estratti vengono utilizzati come input per i tuoi LLM per generare risposte o nuovo testo.

I segmenti estratti possono essere costituiti da più paragrafi, incluso il testo formattato come tabelle ed elenchi puntati.

I segmenti estratti sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Opzioni di segmenti estratti

Per i segmenti estratti sono disponibili le seguenti opzioni:

  • Numero di segmenti: puoi specificare fino a 10 segmenti estratti da restituire per ogni risultato di ricerca.

  • Punteggi di pertinenza: si basano sulla somiglianza della query al segmento estratto. Puoi specificare che i segmenti estratti vengano riportati con i punteggi di pertinenza. I punteggi vanno da -1,0 (meno pertinente) a 1,0 (più pertinente). L'attivazione dei punteggi di pertinenza può aumentare la latenza.

  • Segmenti adiacenti: puoi impostare numPreviousSegments e numNextSegments per ottenere fino a 3 segmenti immediatamente prima e dopo il segmento pertinente. I segmenti adiacenti possono aggiungere contesto e precisione al segmento pertinente.

    L'attivazione di segmenti adiacenti può aumentare la latenza.

Ottieni segmenti estratti

I passaggi riportati di seguito mostrano come ottenere segmenti estratti per i dati non strutturati. Puoi seguire procedure simili per ottenere segmenti estratti per i dati dei siti web.

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveSegmentCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire un segmento per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: il numero di segmenti estratti da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il massimo è 10.

    Opzioni aggiuntive:

    • returnExtractiveSegmentScore: impostato su true per restituire un punteggio di pertinenza con ogni segmento restituito.
    • numPreviousSegments: il numero di segmenti adiacenti da restituire prima del segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.
    • numNextSegments: il numero di segmenti adiacenti da restituire dopo il segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.

    Per ulteriori informazioni su queste opzioni, consulta la sezione Opzioni per i segmenti estratti.

  2. Recupera i segmenti dalla risposta alla ricerca. I segmenti vengono restituiti con ogni risultato di ricerca in extractive_segments.

    In questo esempio di documento restituito come uno dei risultati in una risposta di ricerca, è stato incluso un segmento con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti del segmento di estrazione.

Passaggi successivi