Acerca da obtenção e da classificação

Esta página descreve como a obtenção e a classificação funcionam em conjunto para fornecer resultados da pesquisa relevantes nas apps do Vertex AI Search.

Vista geral

Em resumo, a obtenção consiste em encontrar documentos relevantes, enquanto a classificação consiste em ordenar esses documentos obtidos. A classificação de todos os documentos disponíveis pode ser computacionalmente dispendiosa. Por conseguinte, a obtenção e a classificação funcionam sequencialmente.

Primeiro, o modelo de pesquisa compreende a consulta e reescreve-a. Em seguida, consoante as origens de dados disponíveis e o número de documentos indexados no seu repositório de dados, o modelo obtém documentos na ordem dos milhares. É atribuída uma pontuação de relevância aos documentos obtidos.

Em seguida, o modelo de classificação ordena os documentos obtidos e apresenta os 400 principais resultados classificados. A imagem seguinte mostra como estes dois processos se enquadram no fluxo de trabalho de pesquisa.

obtenção e classificação na pesquisa
Figura 1. Obtenção e classificação no fluxo de trabalho de pesquisa

Métodos de obtenção

A obtenção é o processo de seleção de um subconjunto de documentos do seu repositório de dados que são relevantes para a consulta de um utilizador. O modelo Vertex AI Search gere a obtenção para as suas apps de pesquisa com base em diferentes sinais, como os seguintes, e atribui classificações de relevância:

  • Relevância do tópico: inclui a correspondência de palavras-chave, os gráficos de conhecimento e os sinais da Web.

  • Incorporações: inclui incorporações para encontrar conteúdo conceptualmente semelhante.

  • Atenção cruzada: permite que um modelo considere a relação entre uma consulta e um documento para atribuir uma pontuação de relevância ao documento.

  • Atualidade: envolve determinar a antiguidade dos documentos no armazenamento de dados.

  • Eventos do utilizador: inclui sinais de conversão usados para personalização.

Além disso, num pedido de pesquisa, pode fornecer filtros de relevância e filtros de metadados para dados de Websites e dados estruturados ou não estruturados para restringir a lista de documentos relevantes.

Métodos de classificação

A classificação usa os documentos selecionados durante a fase de obtenção, atribui-lhes uma nova pontuação de relevância de acordo com as seguintes condições e reordena-os:

  • Aumentar: promove e rebaixa determinados resultados de acordo com atributos personalizados ou a atualidade. Isto afeta os primeiros 1000 documentos obtidos e classifica os 400 principais. Para mais informações, consulte o artigo Melhore os resultados da pesquisa.
  • Classificação personalizada: controla, ajusta e substitui a lógica de classificação predefinida com um algoritmo de classificação baseado em fórmulas para se adequar aos seus requisitos específicos. A pontuação de relevância atribuída pela ordenação personalizada tem precedência quando apresenta os resultados. Para mais informações, consulte o artigo Personalize a classificação dos resultados da pesquisa.
  • Ajuste da pesquisa: afeta a forma como o modelo percebe a relevância semântica dos seus documentos e altera as pontuações de relevância da incorporação. Para mais informações, consulte o artigo Melhore os resultados da pesquisa com o ajuste da pesquisa.
  • Reclassificação baseada em eventos: atualiza os resultados no momento da publicação através do modelo de personalização baseado em eventos do utilizador.