Ricevere snippet e contenuti estratti

Vertex AI Search può fornire snippet di ricerca, risposte estrattive e segmenti estrattivi con ogni risposta di ricerca per migliorare i risultati.

  • Snippet: uno snippet è un breve estratto di testo del documento dei risultati di ricerca che fornisce un'anteprima dei contenuti di un risultato di ricerca. Include l'evidenziazione dei risultati che puoi visualizzare nella tua UI. Gli snippet vengono in genere visualizzati sotto ogni risultato di ricerca per aiutare gli utenti finali a valutare la pertinenza e l'utilità del risultato. Gli snippet sono disponibili per i datastore con dati non strutturati e dati di siti web (sia per la ricerca di base sui siti web che per l'indicizzazione avanzata dei siti web).

  • Risposte estrattive: una risposta estrattiva è un testo letterale restituito con ogni risultato di ricerca. Viene estratto direttamente dal documento originale. Le risposte estrattive vengono in genere visualizzate nella parte superiore delle pagine web per fornire all'utente finale una breve risposta pertinente al contesto della sua query. Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

  • Segmenti estrattivi: un segmento estrattivo è un testo letterale restituito con ogni risultato di ricerca. Un segmento estrattivo è in genere più prolisso di una risposta estrattiva. I segmenti estrattivi possono essere visualizzati come risposta a una query e possono essere utilizzati per eseguire attività di post-elaborazione e come input per i modelli linguistici di grandi dimensioni per generare risposte o nuovo testo. I segmenti estrattivi sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Esempi

Gli esempi che seguono aiutano a illustrare le differenze tra snippet, risposte estratte e segmenti estrattivi.

Query: "what is ai applications?" (che cosa sono le applicazioni di AI?)

  • Snippet:

    Per consentire questa operazione, annunciamo le nostre nuove applicazioni AI, il modo più rapido per gli sviluppatori di avviare la creazione di app gen come bot, ...

  • Risposta estrattiva:

    AI Applications consente agli sviluppatori di distribuire rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso alle API dei modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare rapidamente la creazione di app generative in pochi minuti o ore.

  • Segmento estrattivo:

    Anche le aziende e i governi vogliono rendere le interazioni con clienti, partner e dipendenti più efficaci e utili con questa nuova tecnologia di AI. Per consentire tutto questo, annunciamo le nostre nuove applicazioni AI.

    AI Applications consente agli sviluppatori di distribuire rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso alle API dei modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare rapidamente la creazione di app generative in pochi minuti o ore. Con le applicazioni AI, gli sviluppatori potranno anche:

    • Combina i dati dell'organizzazione e le tecniche di recupero delle informazioni per fornire risposte pertinenti.
    • Cerca e rispondi con qualcosa di più di un semplice testo.
    • Combina conversazioni naturali con flussi strutturati.
    • Non limitarti a informare, ma effettua transazioni.

Prima di iniziare

A seconda del tipo di app, completa i seguenti prerequisiti:

Snippet

Gli snippet sono brevi estratti letterali di ogni documento dei risultati di ricerca. Includono l'evidenziazione dei risultati con tag HTML in grassetto per il rendering delle anteprime dei risultati di ricerca in un'interfaccia utente. In genere, gli snippet vengono visualizzati come testo di anteprima sotto un risultato di ricerca per aiutare gli utenti finali a decidere se fare clic su quel risultato di ricerca.

Gli snippet sono disponibili per la ricerca su siti web e non strutturata.

Visualizzare gli snippet

Per ottenere gli snippet:

  1. Invia una richiesta di ricerca che includa ContentSearchSpec.SnippetSpec e imposta returnSnippet su true.

    L'esempio seguente di SnippetSpec specifica che può essere restituito uno snippet per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: se impostato su true, restituisce uno snippet.
  2. Recupera snippet dalla risposta della ricerca. Gli snippet vengono restituiti con ogni risultato di ricerca in derivedStructData.snippets.

    In questo esempio di documento restituito come uno dei risultati in una risposta di ricerca, uno snippet con l'evidenziazione in grassetto è incluso nel risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: Contiene uno snippet generato per il risultato di ricerca del documento. L'evidenziazione dei risultati è inclusa nei tag HTML in grassetto.
    • snippet_status: Se viene generato uno snippet, questo campo viene restituito come SUCCESS. Se non viene generato alcun snippet, questo campo viene restituito come NO_SNIPPET_AVAILABLE.

Risposte estrattive

Una risposta estrattiva è una sezione di testo derivata testualmente da un documento. Quando un documento viene restituito come risultato di ricerca in una risposta di ricerca, con il risultato può essere restituita una risposta estrattiva pertinente.

Una risposta estrattiva può essere un testo come un paragrafo, una tabella o un elenco puntato estratto dal documento dei risultati di ricerca. Le risposte estrattive sono più brevi dei segmenti estrattivi.

Le risposte estrattive possono essere utilizzate in alternativa alle risposte riepilogative nei casi in cui le risposte precise e letterali sono preferibili ai riepiloghi riformulati.

Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Ricevere risposte estrattive

Per ottenere risposte estrattive:

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveAnswerCount.

    L'esempio seguente di extractiveContentSpec specifica che può essere restituita una risposta per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: il numero di risposte estrattive da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 5.
  2. Ricevi risposte estrattive dalla risposta della ricerca. Le risposte estrattive vengono restituite con ogni risultato di ricerca in extractive_answers.

    In questo esempio di documento restituito come uno dei risultati in una risposta di ricerca, è stata inclusa una risposta estrattiva nel risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: Il contenuto della risposta estrattiva.

Segmenti estrattivi

Un segmento estrattivo è una sezione di testo estratta letteralmente da un documento dei risultati di ricerca. I segmenti estrattivi sono simili alle risposte estrattive, ma in genere sono più completi e dettagliati. In genere, i segmenti estrattivi vengono utilizzati come input per i tuoi LLM per generare risposte o nuovo testo.

I segmenti estrattivi possono essere più paragrafi, incluso testo formattato come tabelle ed elenchi puntati.

I segmenti estrattivi sono disponibili per i datastore con dati non strutturati e con indicizzazione avanzata dei siti web.

Opzioni di segmento estrattivo

Per i segmenti estrattivi sono disponibili le seguenti opzioni:

  • Numero di segmenti: puoi specificare fino a 10 segmenti estrattivi da restituire per ogni risultato di ricerca.

  • Punteggi di pertinenza: i punteggi di pertinenza si basano sulla somiglianza della query al segmento estratto. Puoi specificare che i segmenti estrattivi vengano restituiti con punteggi di pertinenza. I punteggi vanno da -1,0 (meno pertinente) a 1,0 (più pertinente). L'attivazione dei punteggi di pertinenza può aumentare la latenza.

  • Segmenti adiacenti: puoi impostare numPreviousSegments e numNextSegments per ottenere fino a tre segmenti immediatamente prima e dopo il segmento pertinente. I segmenti adiacenti possono aggiungere contesto e accuratezza al segmento pertinente.

    L'attivazione dei segmenti adiacenti può aumentare la latenza.

Ottenere segmenti estrattivi

I passaggi seguenti mostrano come ottenere segmenti estrattivi per dati non strutturati. Puoi seguire passaggi simili per ottenere segmenti estrattivi per i dati del sito web.

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveSegmentCount.

    L'esempio seguente di extractiveContentSpec specifica che può essere restituito un segmento per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: il numero di segmenti estrattivi da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 10.

    Opzioni aggiuntive:

    • returnExtractiveSegmentScore: imposta su true per restituire un punteggio di pertinenza con ogni segmento restituito.
    • numPreviousSegments: Il numero di segmenti adiacenti da restituire prima del segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.
    • numNextSegments: il numero di segmenti adiacenti da restituire dopo il segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.

    Per saperne di più su queste opzioni, consulta Opzioni di segmentazione estrattiva.

  2. Recupera i segmenti dalla risposta della ricerca. I segmenti vengono restituiti con ogni risultato di ricerca in extractive_segments.

    In questo esempio di documento restituito come uno dei risultati in una risposta di ricerca, è stato incluso un segmento nel risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: Il contenuto del segmento estrattivo.

Passaggi successivi