Cómo filtrar búsquedas por relevancia a nivel del documento

Cuando realices búsquedas en tu app de Vertex AI Search, puedes aplicar un umbral de relevancia para que solo se muestren como resultados los documentos que cumplan con este umbral. En esta página, se explica cómo especificar un umbral de relevancia para reducir la cantidad de documentos que se muestran en las consultas.

Información acerca del filtrado por relevancia a nivel del documento

Cada documento que muestra una búsqueda tiene un nivel de relevancia, que indica la relevancia del documento para la búsqueda. Cuando realizas una consulta a través de una llamada a la API, puedes establecer un umbral de relevancia. Establecer un umbral de relevancia alto puede reducir la cantidad de documentos que muestra una consulta.

Por ejemplo, si descubres que la búsqueda muestra demasiados documentos con una relevancia insuficiente para tus usuarios, establece el límite de relevancia en alto para limitar los resultados a solo los pocos que sean más relevantes. Si el parámetro de configuración alto es demasiado restrictivo, prueba el parámetro de configuración medio.

Tipos de datos y apps compatibles con el filtro de relevancia a nivel del documento

El filtro de relevancia a nivel del documento se puede aplicar a almacenes de datos con los siguientes tipos de datos:

  • Datos de sitios web con indexación avanzada de sitios web
  • Datos no estructurados genéricos
  • Datos estructurados genéricos

El filtro de relevancia a nivel del documento no funciona con almacenes de datos con indexación básica de sitios web. de medios de comunicación o de atención médica.

Además, el filtro de relevancia a nivel del documento no se puede usar con apps de búsqueda combinadas. Las apps de búsqueda combinada son apps que se conectan a varios almacenes de datos.

Otros tipos de filtros

El filtro de relevancia a nivel del documento no es la única forma de filtrar los datos que muestran las consultas. También puedes usar expresiones de filtro para filtrar resultados según los metadatos (en el indexado avanzado de sitios web y los datos no estructurados con almacenes de datos de metadatos) y los valores de campo (en almacenes de datos estructurados).

Para obtener más información, consulta lo siguiente:

Si usas una expresión de filtro y el filtro de relevancia a nivel del documento, la expresión de filtro se aplica primero a los resultados y, luego, se aplica el filtro de relevancia a nivel del documento.

Antes de comenzar

Asegúrate de haber creado una app y un almacén de datos, y de haber transferido datos al almacén de datos. Para obtener más información, consulta Cómo crear una búsqueda. de la app. Consulta también Tipos de datos y apps compatibles con filtro de relevancia a nivel del documento.

Para filtrar por relevancia, sigue estos pasos:

  1. Busca el ID de tu app. Si ya tienes el ID de la app, ve al siguiente paso.

    1. En la consola de Google Cloud, ve a la página Agent Builder.

      Ir a Apps

    2. En la página Apps, busca el nombre de tu app y obtén el ID en la la columna ID.

  2. Para filtrar la búsqueda por relevancia a nivel del documento, usa el relevanceThreshold con el método engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID: El ID del proyecto de Google Cloud.
    • APP_ID: Es el ID de la app de Vertex AI Search que usaste. que deseas consultar.
    • QUERY: Es el texto de la consulta que se va a buscar.
    • RELEVANCE_THRESHOLD: Uno de los siguientes: HIGH, MEDIUM y LOW LOWEST
  3. Prueba varias consultas con diferentes umbrales para determinar la mejor la configuración del umbral de tus datos y tu aplicación.