Filtrar pesquisas por relevância no nível do documento

Ao pesquisar no app Vertex AI para Pesquisa, é possível aplicar uma para que apenas os documentos que atingem esse limite são retornados como resultados. Esta página explica como especificar limite de relevância para reduzir o número de documentos retornados em consultas.

Sobre a filtragem por relevância no nível do documento

Cada documento retornado por uma consulta de pesquisa recebe um nível de relevância, que indica a relevância do documento retornado para a consulta. Quando você faz usando uma chamada de API, é possível definir um limite de relevância. Definir uma alta o limite de relevância pode reduzir o número de documentos retornados por uma consulta.

Por exemplo, se você descobrir que a pesquisa está retornando muitos documentos de relevância insuficiente para os usuários, defina o limite de relevância como alto para reduzir os resultados apenas aos mais relevantes. Se a configuração alta for muito restritiva, tente a configuração média.

Tipos de dados e apps compatíveis com o filtro de relevância no nível do documento

O filtro de relevância no nível do documento pode ser aplicado a armazenamentos de dados com os seguintes tipos de dados:

  • Dados do site com indexação avançada de sites
  • Dados não estruturados genéricos
  • Dados estruturados genéricos

O filtro de relevância no nível do documento não funciona para repositórios de dados com indexação básica de sites, dados de mídia ou de saúde.

Além disso, o filtro de relevância no nível do documento não pode ser usado com apps de pesquisa combinada. Combinado Os apps de pesquisa são apps conectados a vários repositórios de dados.

Outros tipos de filtro

O filtro de relevância no nível do documento não é a única maneira de filtrar os dados retornados pelas consultas. Também é possível usar expressões de filtro para filtrar resultados com base em metadados (na indexação avançada de sites e dados não estruturados com repositórios de dados de metadados) e valores de campo (em repositórios de dados estruturados).

Confira mais informações em:

Se você usar uma expressão de filtro e o filtro de relevância no nível do documento, a expressão de filtro é aplicado primeiro aos resultados e, em seguida, o filtro de relevância no nível do documento é aplicado.

Antes de começar

Verifique se você criou um app e um repositório de dados e fez a ingestão de dados ao seu repositório de dados. Para mais informações, consulte Criar uma pesquisa app. Consulte também Tipos de dados e apps com suporte para filtro de relevância no nível do documento.

Para filtrar por relevância, siga estas etapas:

  1. Encontre o ID do app. Se você já tiver o ID do app, pule para a próxima etapa.

    1. No Console do Google Cloud, acesse a página Criador de agentes.

      Acessar "Apps".

    2. Na página Apps, localize o nome do seu app e acesse o ID dele na a coluna ID;

  2. Para filtrar a pesquisa pela relevância do documento, use o campo relevanceThreshold com o método engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID: o ID do seu projeto do Google Cloud.
    • APP_ID: o ID do app Vertex AI para Pesquisa que você o que você quer consultar.
    • QUERY: o texto da consulta a ser pesquisada.
    • RELEVANCE_THRESHOLD: um dos seguintes: HIGH, MEDIUM, LOW, LOWEST.
  3. Teste várias consultas com limites diferentes para determinar as melhores configurações de limite para seus dados e aplicativo.