Ao pesquisar no app da Vertex AI para Pesquisa, é possível aplicar um limite de relevância para que apenas os documentos que atendam a esse limite sejam retornados como resultados. Esta página explica como especificar um limite de relevância para reduzir o número de documentos retornados nas consultas.
Sobre a filtragem por relevância no nível do documento
Cada documento retornado por uma consulta de pesquisa recebe um nível de relevância, que indica a relevância do documento retornado para a consulta. Ao fazer uma consulta por meio de uma chamada de API, é possível definir um limite de relevância. Definir um limite de relevância alto pode reduzir o número de documentos retornados por uma consulta.
Por exemplo, se você descobrir que a pesquisa está retornando muitos documentos de relevância insuficiente para os usuários, defina o limite de relevância como alto para reduzir os resultados apenas aos mais relevantes. Se a configuração alta for muito restritiva, tente a configuração média.
Tipos de dados e apps compatíveis com o filtro de relevância no nível do documento
O filtro de relevância no nível do documento pode ser aplicado a armazenamentos de dados com os seguintes tipos de dados:
- Dados do site com indexação avançada de sites
- Dados não estruturados genéricos
- Dados estruturados genéricos
O filtro de relevância no nível do documento não funciona para repositórios de dados com indexação básica de sites, dados de mídia ou de saúde.
Além disso, o filtro de relevância no nível do documento não pode ser usado com apps de pesquisa combinada. Os apps de pesquisa combinada são conectados a vários repositórios de dados.
Outros tipos de filtros
O filtro de relevância no nível do documento não é a única maneira de filtrar os dados retornados pelas consultas. Também é possível usar expressões de filtro para filtrar resultados com base em metadados (na indexação avançada de sites e em dados não estruturados com repositórios de dados de metadados) e valores de campo (em repositórios de dados estruturados).
Confira mais informações em:
Se você usar uma expressão de filtro e o filtro de relevância no nível do documento, a expressão de filtro será aplicada primeiro aos resultados e, em seguida, o filtro de relevância no nível do documento.
Antes de começar
Verifique se você criou um app e um repositório de dados e transferiu dados para o repositório. Para mais informações, consulte Criar um app de pesquisa. Consulte também Tipos de dados e apps compatíveis com o filtro de relevância no nível do documento.
Pesquisar e filtrar resultados por relevância no nível do documento
Para filtrar por relevância, siga estas etapas:
Encontre o ID do app. Se você já tiver o ID do app, pule para a próxima etapa.
No Console do Google Cloud, acesse a página Criador de agentes.
Na página Apps, encontre o nome do app e confira o ID dele na coluna ID.
Para filtrar a pesquisa por relevância no nível do documento, use o campo
relevanceThreshold
com o métodoengines.servingConfigs.search
.curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "relevanceThreshold": "RELEVANCE_THRESHOLD" }'
- PROJECT_ID: o ID do seu projeto do Google Cloud.
- APP_ID: o ID do app da Vertex AI para Pesquisa que você quer consultar.
- QUERY: o texto da consulta a ser pesquisado.
- RELEVANCE_THRESHOLD: um dos seguintes:
HIGH
,MEDIUM
,LOW
,LOWEST
.
Teste várias consultas com limites diferentes para determinar as melhores configurações de limite para seus dados e aplicativo.