Acerca de la recuperación y la clasificación

En esta página, se describe cómo funcionan en conjunto la recuperación y la clasificación para ofrecer resultados de búsqueda pertinentes en las apps de Vertex AI Search.

Descripción general

En resumen, la recuperación consiste en encontrar documentos relevantes, mientras que la clasificación consiste en ordenar esos documentos recuperados. Clasificar todos los documentos disponibles puede ser costoso desde el punto de vista computacional. Por lo tanto, la recuperación y la clasificación funcionan de forma secuencial.

Primero, el modelo de búsqueda comprende la búsqueda y la reescribe. Luego, según las fuentes de datos disponibles y la cantidad de documentos indexados en tu almacén de datos, el modelo recupera documentos en el orden de miles. Se asigna una puntuación de relevancia a los documentos recuperados.

Luego, el modelo de clasificación ordena los documentos recuperados y muestra los 400 resultados mejor clasificados. En la siguiente imagen, se muestra cómo encajan estos dos procesos en el flujo de trabajo de búsqueda.

recuperación y clasificación en la búsqueda
Figura 1. Recuperación y clasificación en el flujo de trabajo de búsqueda

Métodos de recuperación

La recuperación es el proceso de seleccionar un subconjunto de documentos de tu almacén de datos que sean pertinentes para la búsqueda de un usuario. El modelo de Vertex AI Search administra la recuperación de tus apps de búsqueda en función de diferentes indicadores, como los siguientes, y asigna puntuaciones de relevancia:

  • Relevancia del tema: Incluye la coincidencia de palabras clave, los gráficos de conocimiento y los indicadores web.

  • Incorporaciones: Incluye incorporaciones para encontrar contenido conceptualmente similar.

  • Atención cruzada: Permite que un modelo considere la relación entre una búsqueda y un documento para asignarle una puntuación de relevancia.

  • Actualidad: Implica determinar la antigüedad de los documentos en el almacén de datos.

  • Eventos del usuario: Incluyen los indicadores de conversión que se usan para la personalización.

Además, en una solicitud de búsqueda, puedes proporcionar filtros de relevancia y filtros de metadatos para datos de sitios web y datos estructurados o no estructurados para reducir la lista de documentos pertinentes.

Métodos de clasificación

La clasificación toma los documentos que se seleccionan durante la fase de recuperación, les asigna una nueva puntuación de relevancia según las siguientes condiciones y los reordena:

  • Mejora: Promociona y degrada ciertos resultados según atributos personalizados o la actualidad. Esto afecta los primeros 1,000 documentos recuperados y clasifica los primeros 400. Para obtener más información, consulta Cómo potenciar los resultados de la búsqueda.
  • Clasificación personalizada: Controla, ajusta y anula la lógica de clasificación predeterminada con un algoritmo de clasificación basado en fórmulas para satisfacer tus requisitos específicos. La puntuación de relevancia que asigna el ranking personalizado tiene prioridad cuando se publican los resultados. Para obtener más información, consulta Cómo personalizar la clasificación de los resultados de la búsqueda.
  • Ajuste de la búsqueda: Afecta la forma en que el modelo percibe la relevancia semántica de tus documentos y cambia las puntuaciones de relevancia de la incorporación. Para obtener más información, consulta Cómo mejorar los resultados de la búsqueda con el ajuste de la búsqueda.
  • Reordenamiento basado en eventos: Actualiza los resultados en el momento de la publicación con un modelo de personalización basado en eventos del usuario.