Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Cette page explique comment la récupération et le classement fonctionnent ensemble pour fournir des résultats de recherche pertinents dans les applications Vertex AI Search.
Présentation
En bref, la récupération consiste à trouver des documents pertinents, tandis que le classement consiste à ordonner ces documents récupérés. Le classement de tous les documents disponibles peut être coûteux en termes de calcul. Par conséquent, la récupération et le classement fonctionnent de manière séquentielle.
Tout d'abord, le modèle de recherche comprend la requête et la réécrit.
Ensuite, en fonction des sources de données disponibles et du nombre de documents indexés dans votre data store, le modèle récupère des milliers de documents. Un score de pertinence est attribué aux documents récupérés.
Le modèle de classement ordonne ensuite les documents récupérés et renvoie les 400 premiers résultats. L'image suivante montre comment ces deux processus s'intègrent au workflow de recherche.
Figure 1. Récupération et classement dans le workflow de recherche
Méthodes de récupération
La récupération est le processus de sélection d'un sous-ensemble de documents de votre data store qui sont pertinents par rapport à la requête d'un utilisateur. Le modèle Vertex AI Search gère la récupération pour vos applications de recherche en fonction de différents signaux, tels que les suivants, et attribue des scores de pertinence :
Thématique : inclut la correspondance des mots clés, les graphes de connaissances et les signaux Web.
Embeddings : inclut les embeddings pour trouver des contenus conceptuellement similaires.
Attention croisée : permet à un modèle de prendre en compte la relation entre une requête et un document pour attribuer un score de pertinence au document.
Fraîcheur : consiste à déterminer l'âge des documents dans le data store.
Événements utilisateur : incluent les signaux de conversion utilisés pour la personnalisation.
Le classement prend les documents sélectionnés lors de la phase de récupération, leur attribue un nouveau score de pertinence en fonction des conditions suivantes et les réorganise :
Booster : permet de promouvoir ou de rétrograder certains résultats en fonction d'attributs personnalisés ou de leur fraîcheur. Cela a un impact sur les 1 000 premiers documents récupérés et classe les 400 premiers.
Pour en savoir plus, consultez Booster les résultats de recherche.
Classement personnalisé : contrôle, ajuste et remplace la logique de classement par défaut avec un algorithme de classement basé sur des formules pour répondre à vos besoins spécifiques.
Le score de pertinence attribué par le classement personnalisé est prioritaire lors de la diffusion des résultats.
Pour en savoir plus, consultez Personnaliser le classement des résultats de recherche.
Reclassement basé sur les événements : met à jour les résultats au moment de la diffusion à l'aide d'un modèle de personnalisation basé sur les événements utilisateur.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/05 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/05 (UTC)."],[],[],null,["# About retrieval and ranking\n\nThis page describes how retrieval and ranking work together to deliver relevant\nsearch results in Vertex AI Search apps.\n\nOverview\n--------\n\nIn short, retrieval is finding relevant documents, while ranking is\nordering those retrieved documents. Ranking all the available documents\ncan be computationally expensive. Therefore, retrieval and ranking work\nsequentially.\n\nFirst, the search model understands the query and rewrites it.\nThen, depending on the data sources available and the number of indexed\ndocuments in your data store, the model\nretrieves documents in the order of thousands. A relevance score is assigned to\nthe retrieved documents.\n\nThe ranking model then orders the retrieved documents\nand serves the top 400 ranked results. The following image shows how\nthese two processes fit into the search workflow.\n**Figure 1.** Retrieval and ranking in search workflow\n\n### Retrieval methods\n\nRetrieval is the process of selecting a subset of documents from your data store\nthat are relevant to a user's query. Vertex AI Search model\nmanages retrieval for your search apps based on different signals, such as the\nfollowing, and assigns relevance scores:\n\n- **Topicality**: Includes keyword matching, knowledge graphs, and web signals.\n\n- **Embeddings**: Includes embeddings to find conceptually similar content.\n\n- **Cross-attention**: Allows a model to consider the relationship between a\n query and a document to assign a relevance score to the document.\n\n- **Freshness**: Involves ascertaining the age of the documents in the data\n store.\n\n- **User events**: Includes conversion signals used for personalization.\n\nAdditionally, in a search request, you can supply\n[relevance filters](/generative-ai-app-builder/docs/filter-by-relevance) and\nmetadata filters for [website data](/generative-ai-app-builder/docs/filter-website-search)\nand [structured or unstructured data](/generative-ai-app-builder/docs/filter-search-metadata) to\nnarrow down the list of relevant documents.\n\n### Ranking methods\n\nRanking takes the documents that are selected during the retrieval phase,\nassigns them a new relevance score according to the following conditions, and\nreorders them:\n\n- **Boost** : Promotes and demotes certain results according to custom attributes or freshness. This impacts the first 1,000 retrieved documents and ranks the top 400. For more information, see [Boost search results](/generative-ai-app-builder/docs/boost-search-results).\n- **Custom ranking** : Controls, tunes, and overrides the default ranking logic with a formula-based ranking algorithm to suit your specific requirements. The relevance score that custom ranking assigns takes a precedence when serving the results. For more information, see [Customize search results ranking](/generative-ai-app-builder/docs/custom-ranking).\n- **Search tuning** : Impacts how the model perceives the semantic relevance of your documents and changes the embedding relevance scores. For more information, see [Improve search results with search tuning](/generative-ai-app-builder/docs/search-tuning).\n- **Event-based reranking**: Updates the results at the time of serving using user-events-based personalization model."]]