Qualidade de dados

Esta página descreve exemplos de utilização da pesquisa, os respetivos níveis de desempenho e como verificar a consola de pesquisa para comércio para uma avaliação da qualidade dos seus dados e os níveis de desempenho que desbloqueou. Cada nível de desempenho é ativado automaticamente quando cumpre todos os requisitos de dados que impedem a atualização. Também tem de cumprir os requisitos de todos os níveis anteriores para fazer a atualização para o nível seguinte.

Exemplos de utilização da Pesquisa

A Pesquisa fornece resultados da pesquisa para dois exemplos de utilização:

  • Pesquisa por consulta de texto, usada quando os compradores procuram artigos na sua aplicação introduzindo consultas de texto e recebendo um conjunto de resultados relevantes.
  • Procurar pesquisa, usada quando os compradores acedem a uma página de categoria específica, como a página Web da categoria "Eletrodomésticos" do site de retalho de uma loja de melhorias para a casa e procuram os artigos ordenados nessa categoria.

Para saber mais sobre as diferenças entre estes exemplos de utilização, consulte o artigo Acerca da pesquisa de texto e da pesquisa de navegação.

Desbloqueie os níveis de desempenho da pesquisa

A pesquisa por consulta de texto e a pesquisa por navegação têm diferentes níveis de desempenho que melhoram cada vez mais os seus resultados de pesquisa. O desbloqueio dos níveis de desempenho baseia-se nos dados de eventos do utilizador e do catálogo que carrega para o Vertex AI Search para comércio.

Os seguintes níveis de desempenho estão disponíveis para ambos os exemplos de utilização, pesquisa de consultas de texto e navegação:

NÍVEL 1

Relevância:

  • Os resultados são devolvidos com base no grau de relevância para a consulta, como quão preto é um vestido quando se pesquisa um vestido preto.

Requisitos mínimos de dados:

  • Catálogo
  • Consulta

TIER 2

Relevância e popularidade:

  • Refina o NÍVEL 1 para os artigos mais populares na pesquisa consultada.
  • Os produtos igualmente relevantes são classificados pela popularidade do produto no seu site.

Requisitos mínimos de dados: dados de cliques

NÍVEL 3

Classificação otimizada em função da receita: os resultados relevantes são classificados de acordo com a probabilidade de o produto ser comprado com base na atividade específica em todo o site.

Requisitos mínimos de dados: um grande volume de eventos do utilizador.

NÍVEL 4

Classificação personalizada otimizada em função da receita:

  • Os resultados relevantes são classificados pelas preferências do utilizador individual e pela probabilidade de o produto ser comprado com base na atividade do utilizador em todo o site.
  • Produtos classificados com base na "qualidade da correspondência" com o utilizador único que está a pesquisar ou a navegar no site.

Requisitos mínimos de dados:

  • Um grande volume de eventos de utilizador.
  • A correspondência de visitorID e/ou userId, formatada de forma consistente nos eventos do utilizador.

Procurar

BRONZE

Resultados aleatórios

  • Qualquer resultado da pesquisa que se enquadre nos seus filtros, por ordem aleatória.

SILVER

Popularidade

  • Os resultados são devolvidos apenas com base na relevância para a categoria.

OURO

Classificação otimizada em função da receita

  • Os resultados relevantes são classificados pela probabilidade de o produto ser comprado com base na atividade em todo o site.

PLATINUM

Classificação personalizada otimizada em função da receita

  • Os resultados relevantes são classificados pelas preferências do utilizador individual e pela probabilidade de o produto ser comprado com base na atividade em todo o site.

A consola de pesquisa para comércio oferece uma página de Qualidade de dados onde pode verificar se cumpriu os requisitos de dados de cada nível.

As secções seguintes mostram como se inscrever para receber alertas de qualidade de dados que lhe indicam em que níveis os seus dados se enquadram, tendo em conta os parâmetros atuais. Estes alertas também servem como um guia para os requisitos de dados do seu exemplo de utilização específico, de modo a otimizar melhor os resultados da pesquisa.

Verifique a qualidade dos dados

Depois de carregar os dados, aceda à consola de pesquisa para comércio para ver as métricas de verificação de dados para cada nível de desempenho do seu exemplo de utilização.

  1. Aceda à página Qualidade dos dados na consola de pesquisa para comércio.

    Aceda à página Qualidade de dados

  2. Veja as métricas de verificação de dados para o seu exemplo de utilização de pesquisa:

    • Para métricas de pesquisa de texto, clique no separador Pesquisa.
    • Para métricas de pesquisa de navegação, clique no separador Navegar.
  3. Verifique o cartão de pontuação de problemas de cada nível de desempenho na parte superior da página.

    • Se estiver etiquetado como "Em utilização": resolveu todos os problemas de bloqueio para esse nível e desbloqueou-o.
    • Se existirem 0 problemas de bloqueio: cumpriu as verificações de dados para esse nível. Se existirem 0 problemas de bloqueio para este nível e todos os níveis anteriores, demora cerca de 24 horas a preparar o modelo e ativar o nível desbloqueado recentemente.
    • Se existirem problemas de bloqueio: verifique as métricas desse nível para ver que problemas de dados tem de resolver para desbloquear esse nível.
  4. Veja a tabela de métricas de verificação de dados de cada nível de desempenho para ver uma lista de problemas que podem bloquear as atualizações de níveis ou afetar o desempenho da pesquisa.

  5. Verifique a coluna Estado para ver o nível de prioridade de cada métrica de verificação de dados:

    • Bloqueio de atualizações: identifica problemas de dados que impedem que a Pesquisa atualize o seu exemplo de utilização para o nível de desempenho seguinte. Para desbloquear um nível, cumpra todas as verificações de dados de bloqueio de atualização para esse nível de desempenho (e os dos níveis anteriores).
    • Desempenho crítico: identifica problemas de dados que não bloqueiam uma atualização, mas podem ter um impacto significativo no desempenho da pesquisa de texto ou da pesquisa de navegação.
    • Em conformidade: indica que esta verificação de dados foi aprovada.
    • Indisponível: indica que uma verificação de dados de bloqueio de não atualização ainda não foi concluída. Os valores destas métricas são apresentados como N/A. Após a importação de dados, a computação de algumas verificações de dados pode demorar até 24 horas.
  6. Para mais informações sobre qualquer métrica, clique em Detalhes para ver um painel de detalhes que apresenta a descrição, a data/hora da verificação de dados e os valores de limite dessa métrica.

  7. Verifique os limites no painel Detalhes de uma métrica para ver os valores necessários para satisfazer a verificação de dados dessa métrica e melhorar os resultados. Nem todos os limites aplicam-se a todas as métricas:

    • Limite de bloqueio: um limite obrigatório a cumprir para satisfazer a verificação de dados desta métrica.
    • Limite crítico: um limite altamente recomendado a cumprir. O não cumprimento deste limite pode ter um impacto negativo significativo no desempenho.
    • Limite de aviso: um limite recomendado a atingir. Não atingir este limite pode ter um impacto menor no desempenho.

Para importar mais dados de forma a resolver problemas de dados, consulte os artigos Importe eventos de utilizadores do histórico ou Importe informações do catálogo na documentação pública.

Práticas recomendadas

  • Em pedidos de pesquisa e em eventos de utilizadores, forneça IDs de utilizadores, além de IDs de visitantes, para utilizadores com sessão iniciada. Isto permite que a pesquisa personalize os resultados para o utilizador com base nos eventos com sessão iniciada dos utilizadores em todos os dispositivos.
  • Envie eventos do utilizador em tempo real, em vez de carregamentos em lote com um atraso. Isto ajuda a personalizar a pesquisa com base na atividade mais recente de um utilizador no seu site.
  • Carregar todos os eventos do utilizador. Por exemplo, não envie apenas eventos atribuíveis a pesquisas.

Seleção de funcionalidades para níveis otimizados em função da receita mais elevados

O Vertex AI Search para comércio foi atualizado para retalhistas cujos dados atingiram os níveis de desempenho superiores que desbloqueiam capacidades de pesquisa otimizadas para receita. Estes retalhistas nestes níveis superiores podem agora usar a seleção de funcionalidades:

  • Para a funcionalidade Procurar: PRATA e OURO
  • Para a Pesquisa: níveis 3 e 4

Porquê a atualização da classificação?

Os clientes do Vertex AI Search for commerce têm até 10 000 atributos personalizados no respetivo catálogo de produtos, enquanto o modelo de classificação tinha anteriormente apenas 20 caraterísticas estáticas do produto (como o preço e a classificação média) partilhadas por todos os clientes. Isto resultou num modelo de classificação com dados dos produtos muito incompletos e sem capacidade de personalizar as caraterísticas dos produtos para diferentes domínios de retalho e exemplos de utilização, como moda, hardware ou artigos para o lar.

A incapacidade de modelar atributos personalizados levou alguns utilizadores a colocar os atributos que consideravam importantes nas caraterísticas estáticas (fixas) dos produtos. No entanto, isto exigia um esforço manual e só funcionava claramente para um pequeno número de atributos.

Seleção de funcionalidades personalizadas dinâmicas

O Vertex AI Search para comércio atualizou os respetivos níveis otimizados em função da receita para selecionar automaticamente atributos personalizados. A atualização envolve a incorporação de atributos personalizados relevantes no processo de classificação:

  • Analisa todos os atributos personalizados de cada retalhista e escolhe os mais úteis para adicionar ao conjunto de atributos estáticos do produto.
  • Apresenta os atributos selecionados para cada retalhista.
  • Repete o processo de seleção de funcionalidades regularmente (uma vez a cada 30 dias).

Em suma, o Vertex AI Search for commerce não só dá ao modelo de classificação acesso a até 100 vezes ou mais potenciais novas funcionalidades para selecionar para o modelo, como também os atributos de cada cliente são atualizados regularmente para se adaptarem às vendas sazonais e a outras alterações dinâmicas de dados.

A solução de classificação atualizada oferece estatísticas de pesquisa mais poderosas, usando atributos personalizados atualizados regularmente para melhorar a qualidade dos dados.

Conhecimento completo dos produtos

  • Seleção de funcionalidades: o algoritmo do Vertex AI Search for commerce seleciona até 20 atributos personalizados mais importantes para cada retalhista.
  • Vantagens: melhoria da precisão da classificação através da utilização de informações adicionais sobre os produtos, como códigos de saldos e especificações de produtos ou estilos.
  • Visibilidade: os retalhistas podem ver os atributos personalizados selecionados e garantir que são mantidos e estão atualizados.
  • Personalização e aprendizagem: os clientes podem identificar padrões nos atributos personalizados selecionados e adicionar outros relevantes para aumentar ainda mais o desempenho da classificação.

Como ver que atributos estão a ser usados

Se um cliente tiver os níveis mais elevados ativados com pontos de dados de eventos de utilizadores suficientes, as novas informações de atributos personalizados ficam agora visíveis na consola, apresentadas no separador Pesquisa de texto e/ou Pesquisa de navegação na página Qualidade dos dados da Pesquisa para comércio. Aqui, indica-lhe os atributos personalizados que foram escolhidos pelo sistema do Vertex AI Search para comércio.

Texto alternativo

O que fazer com os atributos personalizados

  • Mantenha e não elimine nem descontinue os atributos escolhidos, pois podem afetar o modelo.
  • Melhore a cobertura dos atributos selecionados automaticamente, preenchendo estes campos para mais produtos
  • Examine as tendências em que os atributos personalizados são selecionados automaticamente. Se tiver outros atributos semelhantes, adicione-os ao catálogo. Tornam-se candidatos à seleção pelo algoritmo de pesquisa de funcionalidades.
  • Anote corretamente os atributos numéricos atribuindo-lhes valores numéricos em vez de valores de string. Por exemplo, forneça um valor numérico de 10.5, em vez de texto ("10,5").

Desative a personalização

Para desativar a personalização, defina ServingConfig.personalizationSpec como mode.DISABLED.

Alertas de qualidade de dados

Os alertas de qualidade dos dados são acionados se o valor de uma métrica no painel de controlo mudar de satisfatório para não satisfatório. Os alertas são enviados por email.

Se quiser ver alertas relacionados com o Cloud Monitoring, aceda a Configurar alertas.

Veja a qualidade dos dados

  1. Aceda à página Qualidade dos dados na consola de pesquisa para comércio.

    Aceda à página Qualidade de dados

  2. Reveja linhas, métricas e alertas: uma linha corresponde a uma métrica e uma métrica corresponde a um alerta.

Configure alertas de qualidade dos dados

REST

Chame a API UpdateAlertConfig.

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "ENROLLED",
      "recipients": [
        {
          "emailAddress": "EMAIL_ADDRESS_1"
        },
        {
          "emailAddress": "EMAIL_ADDRESS_2"
        }
      ]
    }
  ]
}'

Substitua o seguinte:

  • PROJECT_ID: o ID do seu projeto Google Cloud .
  • EMAIL_ADDRESS_1, EMAIL_ADDRESS_2: os endereços de email nos quais quer inscrever-se para receber os alertas. Devem estar em conformidade com o SMTP. É possível adicionar, no máximo, 20 endereços de email a uma política de alerta.

Consola

  1. Aceda à página Qualidade dos dados na consola de pesquisa para comércio.

    Aceda à página Qualidade de dados

  2. Na parte superior, clique em Configurar alertas.

  3. Adicione, pelo menos, um endereço de email. Os endereços de email devem estar em conformidade com o protocolo SMTP (Simple Mail Transfer Protocol). Pode adicionar, no máximo, 20 endereços de email a uma política de alerta.

  4. Clique em Enviar.

Desative os alertas de qualidade de dados

REST

Chame a API UpdateAlertConfig.

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "DECLINED",
      "recipients": [
      ]
    }
  ]
}'

Substitua o seguinte:

  • PROJECT_ID: o ID do seu projeto Google Cloud .

Consola

  1. Aceda à página Qualidade dos dados na consola de pesquisa para comércio.

    Aceda à página Qualidade de dados

  2. Clique em Configurar alertas.

  3. Eliminar todos os emails existentes.

  4. Clique em Enviar.

Resolver problemas

Veja como resolver os seguintes problemas comuns.

A verificação de dados não está a ser aprovada

Se uma verificação de dados não estiver a ser aprovada, clique em Detalhes para essa métrica na página Qualidade dos dados para ver uma descrição mais detalhada dessa métrica e os limites a atingir que satisfazem essa verificação de dados.

Se já cumpriu os requisitos de dados, verifique a secção Data/hora para saber quando essa métrica foi calculada pela última vez. Se tiver reformatado ou carregado recentemente uma quantidade significativa de dados, pode demorar várias horas a recalcular essa métrica.

Se não cumpriu os requisitos de dados, pode ter de reformatar os dados ou recolher mais dados para cumprir os requisitos de verificação de dados. Depois de se certificar de que os dados cumprem o limite da métrica, volte a importar os dados reformatados ou importe os dados adicionais e, em seguida, aguarde que a métrica seja recalculada.

Um valor de métrica etiquetado como N/A

Os valores das métricas são apresentados como N/A se não tiverem sido carregados dados ou se as métricas ainda não tiverem sido calculadas. Após a importação de dados, a computação de algumas verificações de dados pode demorar até 24 horas.

O nível de desempenho não tem problemas de bloqueio, mas não está a ser usado

Para resolver problemas, siga estes passos:

  1. Verifique se existem problemas de dados de bloqueio para os níveis anteriores. Tem de cumprir os requisitos de todos os níveis anteriores para atualizar para o nível seguinte.

  2. Aguarde 24 horas. Depois de todas as verificações de dados que bloqueiam a atualização serem aprovadas, a preparação do modelo e a ativação do nível desbloqueado recentemente demoram cerca de 24 horas.

Se o nível de desempenho não estiver marcado como em utilização no prazo de dois dias após a aprovação em todas as verificações de dados de bloqueio de atualização, contacte o apoio técnico do Vertex AI Search for commerce com o número e o ID do projeto para receber assistência.

Informações adicionais sobre os requisitos de dados

Para saber mais sobre os requisitos de dados do Vertex AI Search para comércio, consulte a documentação:

O que se segue?