Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta página, se describe cómo funcionan en conjunto la recuperación y la clasificación para ofrecer resultados de búsqueda pertinentes en las apps de Vertex AI Search.
Descripción general
En resumen, la recuperación consiste en encontrar documentos relevantes, mientras que la clasificación consiste en ordenar esos documentos recuperados. Clasificar todos los documentos disponibles puede ser costoso desde el punto de vista computacional. Por lo tanto, la recuperación y la clasificación funcionan de forma secuencial.
Primero, el modelo de búsqueda comprende la búsqueda y la reescribe.
Luego, según las fuentes de datos disponibles y la cantidad de documentos indexados en tu almacén de datos, el modelo recupera documentos en el orden de miles. Se asigna una puntuación de relevancia a los documentos recuperados.
Luego, el modelo de clasificación ordena los documentos recuperados y muestra los 400 resultados mejor clasificados. En la siguiente imagen, se muestra cómo encajan estos dos procesos en el flujo de trabajo de búsqueda.
Figura 1. Recuperación y clasificación en el flujo de trabajo de búsqueda
Métodos de recuperación
La recuperación es el proceso de seleccionar un subconjunto de documentos de tu almacén de datos que sean pertinentes para la búsqueda de un usuario. El modelo de Vertex AI Search administra la recuperación de tus apps de búsqueda en función de diferentes indicadores, como los siguientes, y asigna puntuaciones de relevancia:
Relevancia del tema: Incluye la coincidencia de palabras clave, los gráficos de conocimiento y los indicadores web.
Incorporaciones: Incluye incorporaciones para encontrar contenido conceptualmente similar.
Atención cruzada: Permite que un modelo considere la relación entre una búsqueda y un documento para asignarle una puntuación de relevancia.
Actualidad: Implica determinar la antigüedad de los documentos en el almacén de datos.
Eventos del usuario: Incluyen los indicadores de conversión que se usan para la personalización.
La clasificación toma los documentos que se seleccionan durante la fase de recuperación, les asigna una nueva puntuación de relevancia según las siguientes condiciones y los reordena:
Mejora: Promociona y degrada ciertos resultados según atributos personalizados o la actualidad. Esto afecta los primeros 1,000 documentos recuperados y clasifica los primeros 400.
Para obtener más información, consulta Cómo potenciar los resultados de la búsqueda.
Clasificación personalizada: Controla, ajusta y anula la lógica de clasificación predeterminada con un algoritmo de clasificación basado en fórmulas para satisfacer tus requisitos específicos.
La puntuación de relevancia que asigna el ranking personalizado tiene prioridad cuando se publican los resultados.
Para obtener más información, consulta Cómo personalizar la clasificación de los resultados de la búsqueda.
Reordenamiento basado en eventos: Actualiza los resultados en el momento de la publicación con un modelo de personalización basado en eventos del usuario.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-05 (UTC)"],[],[],null,["# About retrieval and ranking\n\nThis page describes how retrieval and ranking work together to deliver relevant\nsearch results in Vertex AI Search apps.\n\nOverview\n--------\n\nIn short, retrieval is finding relevant documents, while ranking is\nordering those retrieved documents. Ranking all the available documents\ncan be computationally expensive. Therefore, retrieval and ranking work\nsequentially.\n\nFirst, the search model understands the query and rewrites it.\nThen, depending on the data sources available and the number of indexed\ndocuments in your data store, the model\nretrieves documents in the order of thousands. A relevance score is assigned to\nthe retrieved documents.\n\nThe ranking model then orders the retrieved documents\nand serves the top 400 ranked results. The following image shows how\nthese two processes fit into the search workflow.\n**Figure 1.** Retrieval and ranking in search workflow\n\n### Retrieval methods\n\nRetrieval is the process of selecting a subset of documents from your data store\nthat are relevant to a user's query. Vertex AI Search model\nmanages retrieval for your search apps based on different signals, such as the\nfollowing, and assigns relevance scores:\n\n- **Topicality**: Includes keyword matching, knowledge graphs, and web signals.\n\n- **Embeddings**: Includes embeddings to find conceptually similar content.\n\n- **Cross-attention**: Allows a model to consider the relationship between a\n query and a document to assign a relevance score to the document.\n\n- **Freshness**: Involves ascertaining the age of the documents in the data\n store.\n\n- **User events**: Includes conversion signals used for personalization.\n\nAdditionally, in a search request, you can supply\n[relevance filters](/generative-ai-app-builder/docs/filter-by-relevance) and\nmetadata filters for [website data](/generative-ai-app-builder/docs/filter-website-search)\nand [structured or unstructured data](/generative-ai-app-builder/docs/filter-search-metadata) to\nnarrow down the list of relevant documents.\n\n### Ranking methods\n\nRanking takes the documents that are selected during the retrieval phase,\nassigns them a new relevance score according to the following conditions, and\nreorders them:\n\n- **Boost** : Promotes and demotes certain results according to custom attributes or freshness. This impacts the first 1,000 retrieved documents and ranks the top 400. For more information, see [Boost search results](/generative-ai-app-builder/docs/boost-search-results).\n- **Custom ranking** : Controls, tunes, and overrides the default ranking logic with a formula-based ranking algorithm to suit your specific requirements. The relevance score that custom ranking assigns takes a precedence when serving the results. For more information, see [Customize search results ranking](/generative-ai-app-builder/docs/custom-ranking).\n- **Search tuning** : Impacts how the model perceives the semantic relevance of your documents and changes the embedding relevance scores. For more information, see [Improve search results with search tuning](/generative-ai-app-builder/docs/search-tuning).\n- **Event-based reranking**: Updates the results at the time of serving using user-events-based personalization model."]]