Cuando realices búsquedas en tu app de Vertex AI Search, puedes aplicar un umbral de relevancia para que solo se muestren como resultados los documentos que cumplan con este umbral. En esta página, se explica cómo especificar un umbral de relevancia para reducir la cantidad de documentos que se muestran en las consultas.
Información acerca del filtrado por relevancia a nivel del documento
Cada documento que muestra una búsqueda tiene un nivel de relevancia, que indica la relevancia del documento para la búsqueda. Cuando realizas una consulta a través de una llamada a la API, puedes establecer un umbral de relevancia. Establecer un umbral de relevancia alto puede reducir la cantidad de documentos que muestra una consulta.
Por ejemplo, si descubres que la búsqueda muestra demasiados documentos con una relevancia insuficiente para tus usuarios, establece el límite de relevancia en alto para limitar los resultados a solo los pocos que sean más relevantes. Si el parámetro de configuración alto es demasiado restrictivo, prueba el parámetro de configuración medio.
Tipos de datos y apps compatibles con el filtro de relevancia a nivel del documento
El filtro de relevancia a nivel del documento se puede aplicar a los almacenes de datos con los siguientes tipos de datos:
- Datos de sitios web con indexación avanzada de sitios web
- Datos no estructurados genéricos
- Datos estructurados genéricos
El filtro de relevancia a nivel del documento no funciona para los almacenes de datos con indexación básica de sitios web, datos de medios o datos de atención médica.
Además, el filtro de relevancia a nivel del documento no se puede usar con apps de búsqueda combinada. Las apps de búsqueda combinada son apps que se conectan a varios almacenes de datos.
Otros tipos de filtros
El filtro de relevancia a nivel del documento no es la única forma de filtrar los datos que muestran las consultas. También puedes usar expresiones de filtro para filtrar resultados según los metadatos (en la indexación avanzada de sitios web y los datos no estructurados con almacenes de datos de metadatos) y los valores de campo (en almacenes de datos estructurados).
Para obtener información, consulta los siguientes recursos:
Si usas una expresión de filtro y el filtro de relevancia a nivel del documento, la expresión de filtro se aplica primero a los resultados y, luego, se aplica el filtro de relevancia a nivel del documento.
Antes de comenzar
Asegúrate de haber creado una app y un almacén de datos, y de haber transferido datos al almacén de datos. Para obtener más información, consulta Cómo crear una app de búsqueda. Consulta también Tipos de datos y apps compatibles con el filtro de relevancia a nivel del documento.
Busca y filtra los resultados por relevancia a nivel del documento
Para filtrar por relevancia, sigue estos pasos:
Busca el ID de tu app. Si ya tienes el ID de tu app, ve al siguiente paso.
En la consola de Google Cloud, ve a la página Agent Builder.
Ve a Apps.
En la página Apps, busca el nombre de tu app y obtén su ID de la columna ID.
Para filtrar la búsqueda por relevancia a nivel del documento, usa el campo
relevanceThreshold
con el métodoengines.servingConfigs.search
.curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "relevanceThreshold": "RELEVANCE_THRESHOLD" }'
- PROJECT_ID: El ID del proyecto de Google Cloud.
- APP_ID: El ID de la app de Vertex AI Search que quieres consultar.
- QUERY: Es el texto de la búsqueda.
- RELEVANCE_THRESHOLD: Es uno de los siguientes:
HIGH
,MEDIUM
,LOW
,LOWEST
.
Prueba varias consultas con diferentes umbrales para determinar la mejor configuración de umbral para tus datos y tu aplicación.