Acerca de la recuperación y la clasificación

En esta página se describe cómo funcionan conjuntamente la recuperación y la clasificación para ofrecer resultados de búsqueda relevantes en las aplicaciones de Vertex AI Search.

Información general

En resumen, la recuperación consiste en encontrar documentos relevantes, mientras que la clasificación consiste en ordenar esos documentos recuperados. Clasificar todos los documentos disponibles puede ser costoso desde el punto de vista computacional. Por lo tanto, la recuperación y la clasificación funcionan de forma secuencial.

En primer lugar, el modelo de búsqueda interpreta la consulta y la reescribe. A continuación, en función de las fuentes de datos disponibles y del número de documentos indexados de tu almacén de datos, el modelo recupera documentos por miles. Se asigna una puntuación de relevancia a los documentos obtenidos.

A continuación, el modelo de clasificación ordena los documentos recuperados y ofrece los 400 resultados mejor clasificados. En la siguiente imagen se muestra cómo encajan estos dos procesos en el flujo de trabajo de búsqueda.

recuperación y clasificación en la búsqueda
Imagen 1. Recuperación y clasificación en el flujo de trabajo de búsqueda

Métodos de recuperación

La recuperación es el proceso de seleccionar un subconjunto de documentos de tu almacén de datos que sean relevantes para la consulta de un usuario. El modelo de búsqueda de Vertex AI gestiona la recuperación de tus aplicaciones de búsqueda en función de diferentes señales, como las siguientes, y asigna puntuaciones de relevancia:

  • Temática: incluye la concordancia de palabras clave, los gráficos de conocimiento y las señales web.

  • Inserciones: incluye inserciones para encontrar contenido conceptualmente similar.

  • Atención cruzada: permite que un modelo tenga en cuenta la relación entre una consulta y un documento para asignar una puntuación de relevancia al documento.

  • Actualización: se trata de determinar la antigüedad de los documentos del almacén de datos.

  • Eventos de usuario: incluye señales de conversión que se usan para la personalización.

Además, en una solicitud de búsqueda, puedes proporcionar filtros de relevancia y filtros de metadatos para datos de sitios web y datos estructurados o sin estructurar para acotar la lista de documentos relevantes.

Métodos de clasificación

La clasificación toma los documentos seleccionados durante la fase de recuperación, les asigna una nueva puntuación de relevancia según las siguientes condiciones y los reordena:

  • Impulso: promociona o rebaja determinados resultados en función de atributos personalizados o de la actualidad. Esto afecta a los primeros 1000 documentos recuperados y clasifica los 400 primeros. Para obtener más información, consulta el artículo Impulsar resultados de búsqueda.
  • Ranking personalizado: controla, ajusta y anula la lógica de ranking predeterminada con un algoritmo de ranking basado en fórmulas para adaptarlo a tus requisitos específicos. La puntuación de relevancia que asigna la clasificación personalizada tiene prioridad a la hora de mostrar los resultados. Para obtener más información, consulta el artículo Personalizar la clasificación de los resultados de búsqueda.
  • Ajuste de la búsqueda: influye en la forma en que el modelo percibe la relevancia semántica de tus documentos y cambia las puntuaciones de relevancia de las inserciones. Para obtener más información, consulta el artículo Mejorar los resultados de búsqueda con la optimización de la búsqueda.
  • Reclasificación basada en eventos: actualiza los resultados en el momento de la publicación mediante un modelo de personalización basado en eventos de usuario.