Informazioni su recupero e ranking

Questa pagina descrive come il recupero e il ranking funzionano insieme per fornire risultati di ricerca pertinenti nelle app Vertex AI Search.

Panoramica

In breve, il recupero consiste nel trovare i documenti pertinenti, mentre il ranking consiste nell'ordinare i documenti recuperati. Classificare tutti i documenti disponibili può essere costoso dal punto di vista computazionale. Pertanto, il recupero e il ranking funzionano in sequenza.

Innanzitutto, il modello di ricerca comprende la query e la riscrive. A seconda delle origini dati disponibili e del numero di documenti indicizzati nel datastore, il modello recupera i documenti nell'ordine di migliaia. Ai documenti recuperati viene assegnato un punteggio di pertinenza.

Il modello di ranking ordina quindi i documenti recuperati e mostra i primi 400 risultati classificati. L'immagine seguente mostra come questi due processi si inseriscono nel flusso di lavoro di ricerca.

recupero e ranking nella ricerca
Figura 1. Recupero e ranking nel flusso di lavoro di ricerca

Metodi di recupero

Il recupero è il processo di selezione di un sottoinsieme di documenti dall'archivio dati pertinenti alla query di un utente. Il modello Vertex AI Search gestisce il recupero per le tue app di ricerca in base a diversi indicatori, ad esempio i seguenti, e assegna punteggi di pertinenza:

  • Pertinenza: include la corrispondenza delle parole chiave, i knowledge graph e gli indicatori web.

  • Embedding: include gli embedding per trovare contenuti concettualmente simili.

  • Cross-attention: consente a un modello di considerare la relazione tra una query e un documento per assegnare un punteggio di pertinenza al documento.

  • Aggiornamento: consiste nel determinare l'età dei documenti nell'archivio dati.

  • Eventi utente: include gli indicatori di conversione utilizzati per la personalizzazione.

Inoltre, in una richiesta di ricerca puoi fornire filtri di pertinenza e filtri di metadati per dati di siti web e dati strutturati o non strutturati per restringere l'elenco dei documenti pertinenti.

Metodi di ranking

Il ranking prende i documenti selezionati durante la fase di recupero, assegna loro un nuovo punteggio di pertinenza in base alle seguenti condizioni e li riordina:

  • Incremento: promuove e declassa determinati risultati in base ad attributi personalizzati o alla loro freschezza. Questo influisce sui primi 1000 documenti recuperati e classifica i primi 400. Per saperne di più, vedi Migliorare i risultati di ricerca.
  • Ranking personalizzato: controlla, ottimizza e sostituisce la logica di ranking predefinita con un algoritmo di ranking basato su formule per soddisfare i tuoi requisiti specifici. Il punteggio di pertinenza assegnato dal ranking personalizzato ha la precedenza quando vengono mostrati i risultati. Per saperne di più, consulta Personalizzare il ranking dei risultati di ricerca.
  • Ottimizzazione della ricerca: influisce sul modo in cui il modello percepisce la pertinenza semantica dei tuoi documenti e modifica i punteggi di pertinenza degli incorporamenti. Per saperne di più, consulta Migliorare i risultati di ricerca con l'ottimizzazione della ricerca.
  • Riassegnazione del ranking basata sugli eventi: aggiorna i risultati al momento della pubblicazione utilizzando il modello di personalizzazione basato sugli eventi utente.