Cette page a été traduite par l'API Cloud Translation.

À propos de la récupération et du classement

Cette page explique comment la récupération et le classement fonctionnent ensemble pour fournir des résultats de recherche pertinents dans les applications Vertex AI Search.

Présentation

En bref, la récupération consiste à trouver des documents pertinents, tandis que le classement consiste à ordonner ces documents récupérés. Le classement de tous les documents disponibles peut être coûteux en termes de calcul. Par conséquent, la récupération et le classement fonctionnent de manière séquentielle.

Tout d'abord, le modèle de recherche comprend la requête et la réécrit. Ensuite, en fonction des sources de données disponibles et du nombre de documents indexés dans votre data store, le modèle récupère des milliers de documents. Un score de pertinence est attribué aux documents récupérés.

Le modèle de classement ordonne ensuite les documents récupérés et renvoie les 400 premiers résultats. L'image suivante montre comment ces deux processus s'intègrent au workflow de recherche.

la récupération et le classement dans la recherche ; — **Figure 1.** Récupération et classement dans le workflow de recherche

Méthodes de récupération

La récupération est le processus de sélection d'un sous-ensemble de documents de votre data store qui sont pertinents par rapport à la requête d'un utilisateur. Le modèle Vertex AI Search gère la récupération pour vos applications de recherche en fonction de différents signaux, tels que les suivants, et attribue des scores de pertinence :

Thématique : inclut la correspondance des mots clés, les graphes de connaissances et les signaux Web.
Embeddings : inclut les embeddings permettant de trouver des contenus conceptuellement similaires.
Attention croisée : permet à un modèle de prendre en compte la relation entre une requête et un document pour attribuer un score de pertinence au document.
Fraîcheur : consiste à déterminer l'ancienneté des documents dans le data store.
Événements utilisateur : incluent les signaux de conversion utilisés pour la personnalisation.

De plus, dans une requête de recherche, vous pouvez fournir des filtres de pertinence et des filtres de métadonnées pour les données de site Web et les données structurées ou non structurées afin de réduire la liste des documents pertinents.

Méthodes de classement

Le classement prend les documents sélectionnés lors de la phase de récupération, leur attribue un nouveau score de pertinence en fonction des conditions suivantes et les réorganise :

Booster : permet de promouvoir ou de rétrograder certains résultats en fonction d'attributs personnalisés ou de leur fraîcheur. Cela a un impact sur les 1 000 premiers documents récupérés et classe les 400 premiers. Pour en savoir plus, consultez Booster les résultats de recherche.
Classement personnalisé : contrôle, ajuste et remplace la logique de classement par défaut avec un algorithme de classement basé sur des formules pour répondre à vos besoins spécifiques. Le score de pertinence attribué par le classement personnalisé est prioritaire lors de la diffusion des résultats. Pour en savoir plus, consultez Personnaliser le classement des résultats de recherche.
Ajustement de la recherche : a un impact sur la façon dont le modèle perçoit la pertinence sémantique de vos documents et modifie les scores de pertinence des embeddings. Pour en savoir plus, consultez Améliorer les résultats de recherche grâce au réglage de la recherche.
Reclassement basé sur les événements : met à jour les résultats au moment de la diffusion à l'aide d'un modèle de personnalisation basé sur les événements utilisateur.