Qualidade dos dados

Esta página descreve os casos de uso da pesquisa, os respectivos níveis de desempenho e como verificar o console da Pesquisa para varejo para uma avaliação da qualidade dos dados e quais níveis de desempenho você desbloqueou. Cada nível de desempenho é ativado automaticamente quando você atende a todos os requisitos de dados que bloqueiam a atualização. Você também precisa atender aos requisitos de todos os níveis anteriores para fazer upgrade para o próximo nível.

Pesquisar casos de uso

A pesquisa fornece resultados para dois casos de uso:

  • Pesquisa de consulta de texto, usada quando os compradores procuram itens no seu app inserindo consultas de texto e recebendo um conjunto de resultados relevantes.
  • Pesquisa de navegação, usada quando os compradores acessam uma página de categoria específica, como a página da categoria "Eletrodomésticos" do site de varejo de uma loja de reformas e navegam pelos itens classificados nessa categoria.

Para saber mais sobre as diferenças entre esses casos de uso, consulte Sobre a pesquisa de texto e a pesquisa de navegação.

Desbloquear níveis de performance da pesquisa

A pesquisa de consulta de texto e a pesquisa de navegação têm níveis de desempenho diferentes que melhoram cada vez mais os resultados da pesquisa. O desbloqueio de níveis de performance depende dos dados de evento do usuário e do catálogo que você envia para a Vertex AI para Pesquisa para varejo.

Os seguintes níveis de desempenho estão disponíveis para os dois casos de uso, pesquisa de consulta de texto e navegação:

NÍVEL 1

Relevância:

  • Os resultados são retornados com base no grau de relevância para a consulta, como como um vestido é preto quando uma consulta é feita para um vestido preto.

Requisitos mínimos de dados:

  • Catálogo
  • Consulta

NÍVEL 2

Relevância e popularidade:

  • Refina o NÍVEL 1 para os itens mais populares na pesquisa consultada.
  • Os produtos igualmente relevantes são classificados pela popularidade deles no seu site.

Requisitos mínimos de dados: dados de cliques

NÍVEL 3

Classificação otimizada para receita: os resultados relevantes são classificados pela probabilidade de compra do produto com base em atividades específicas em todo o site.

Requisitos mínimos de dados: um grande volume de eventos do usuário.

NÍVEL 4

Classificação personalizada otimizada para receita:

  • Os resultados relevantes são classificados de acordo com as preferências do usuário e a probabilidade de compra do produto com base na atividade do usuário em todo o site.
  • Os produtos são classificados com base na "qualidade da correspondência" para o usuário único que pesquisa ou navega no site.

Requisitos mínimos de dados:

  • Um grande volume de eventos do usuário.
  • Corresponde a visitorID e/ou userId, formatado de forma consistente nos eventos do usuário.

Procurar

BRONZE

Resultados aleatórios

  • Qualquer resultado de pesquisa que se encaixe nos seus filtros, em ordem aleatória.

SILVER

Popularidade

  • Os resultados são retornados com base apenas na relevância para a categoria.

OURO

Classificação otimizada para receita

  • Os resultados relevantes são classificados pela probabilidade de compra do produto com base na atividade em todo o site.

PLATINUM

Classificação personalizada otimizada para receita

  • Os resultados relevantes são classificados de acordo com as preferências do usuário e a probabilidade de compra do produto com base na atividade em todo o site.

O console de Pesquisa para varejo oferece uma página Qualidade dos dados em que você pode verificar se atendeu aos requisitos de dados de cada nível.

As próximas seções mostram como se inscrever em alertas de qualidade de dados que notificam em qual nível seus dados se enquadram, considerando seus parâmetros atuais. Esses alertas também servem como um guia para os requisitos de dados específicos do seu caso de uso para otimizar melhor os resultados da pesquisa.

Verificar a qualidade dos dados

Depois de fazer o upload dos dados, acesse o console do Search for Retail para conferir as métricas de verificação de dados de cada nível de performance do seu caso de uso.

  1. Acesse a página Qualidade dos dados no console da Pesquisa para varejo.

    Acesse a página "Qualidade dos dados"

  2. Confira as métricas de verificação de dados para seu caso de uso de pesquisa:

    • Para métricas de pesquisa de texto, clique na guia Pesquisa.
    • Para ver as métricas de pesquisa de navegação, clique na guia Navegação.
  3. Verifique a pontuação de cada nível de desempenho na parte de cima da página.

    • Se estiver marcado como "Em uso": você atendeu a todos os problemas de bloqueio para esse nível e o desbloqueou.
    • Se não houver problemas de bloqueio:você atendeu às verificações de dados para esse nível. Se não houver problemas de bloqueio para esse nível e todos os níveis anteriores, o treinamento e a preparação do modelo e a ativação do nível recém-desbloqueado vão levar cerca de 24 horas.
    • Se houver problemas de bloqueio:verifique as métricas do nível para saber quais problemas de dados precisam ser resolvidos para desbloquear esse nível.
  4. Acesse a tabela de métricas de verificação de dados de cada nível de performance para conferir uma lista de problemas que podem bloquear upgrades de nível ou afetar a performance da pesquisa.

  5. Verifique o nível de prioridade de cada métrica de verificação de dados na coluna Status:

    • Bloqueio de upgrade: identifica problemas de dados que impedem a Pesquisa de atualizar seu caso de uso para o próximo nível de desempenho. Para desbloquear um nível, realize todas as verificações de dados de bloqueio de upgrade para esse nível de desempenho (e para os níveis anteriores).
    • Problema crítico de desempenho: identifica problemas de dados que não bloqueiam um upgrade, mas podem ter um impacto significativo na pesquisa de texto ou na pesquisa de navegação.
    • Em conformidade: indica que a verificação de dados foi aprovada.
    • Indisponível: indica que uma verificação de dados de bloqueio sem upgrade ainda não foi concluída. Os valores dessas métricas são mostrados como N/A. Pode levar até 24 horas após a importação de dados para computar algumas verificações de dados.
  6. Para mais informações sobre qualquer métrica, clique em Detalhes para acessar um painel de detalhes que mostra a descrição da métrica, o carimbo de data/hora da verificação de dados e os valores de limite.

  7. Verifique os limites no painel Detalhes de uma métrica para conferir os valores necessários para atender à verificação de dados da métrica e melhorar os resultados. Nem todos os limites se aplicam a todas as métricas:

    • Limite de bloqueio: um limite necessário para atender à verificação de dados dessa métrica.
    • Limite crítico: um limite altamente recomendado. Não atender a esse limite pode ter um impacto negativo significativo na performance.
    • Limite de alerta: um limite recomendado. Não atender a esse limite pode ter um impacto menor no desempenho.

Para importar mais dados e resolver problemas, consulte Importar eventos históricos do usuário ou Importar informações do catálogo na documentação pública.

Práticas recomendadas

  • Em solicitações de pesquisa e eventos do usuário, forneça IDs de usuário, além de IDs de visitante para usuários conectados. Isso permite que a pesquisa personalize os resultados para o usuário com base nos eventos de login em todos os dispositivos.
  • Envie eventos do usuário em tempo real em vez de fazer uploads em lote com atraso. Isso ajuda a personalizar a pesquisa usando a atividade mais recente de um usuário no seu site.
  • Faça upload de todos os eventos do usuário. Por exemplo, não envie apenas eventos que sejam atribuídos a pesquisas.

Seleção de recursos para os níveis superiores otimizados para receita

A Vertex AI para Pesquisa para varejo foi atualizada para varejistas cujos dados alcançaram os níveis de desempenho mais altos que liberam recursos de pesquisa otimizados para a receita. Os varejistas desses níveis mais altos agora podem usar a seleção de recursos:

  • Para navegar: PRATA e OURO
  • Para a Pesquisa: níveis 3 e 4

Por que o upgrade de classificação?

Os clientes da Vertex AI Search para varejo de grande porte têm até 10.000 atributos personalizados no catálogo de produtos, enquanto o modelo de classificação tinha apenas 20 recursos de produtos estáticos (como preço e classificação média) compartilhados entre todos os clientes. Isso resultou em dados de produtos muito incompletos no modelo de classificação e na incapacidade de personalizar os recursos do produto para diferentes domínios de varejo e casos de uso, como moda, hardware ou produtos para casa.

A incapacidade de modelar atributos personalizados levou alguns usuários a colocar os atributos que consideravam importantes nos recursos de produtos estáticos (fixos). No entanto, isso exigia esforço manual e funcionava apenas para um pequeno número de atributos.

Seleção de recursos personalizados dinâmicos

A Vertex AI para Pesquisa para varejo atualizou os níveis otimizados para receita para selecionar automaticamente atributos personalizados. O upgrade envolve a incorporação de atributos personalizados relevantes ao processo de classificação:

  • Analisa todos os atributos personalizados de cada varejista e escolhe os mais úteis para serem adicionados ao conjunto de recursos de produtos estáticos.
  • Mostra os atributos selecionados para cada varejista.
  • Repita o processo de seleção de recursos regularmente (uma vez a cada 30 dias).

Em resumo, a Vertex AI Search for Retail não apenas dá ao modelo de classificação acesso a até 100 ou mais novos recursos potenciais para selecionar, mas também atualiza os atributos de cada cliente regularmente para se adaptar às vendas sazonais e outras mudanças dinâmicas de dados.

A solução de classificação atualizada oferece insights de pesquisa mais poderosos, usando atributos personalizados atualizados regularmente para melhorar a qualidade dos dados.

Conhecimento completo do produto

  • Seleção de atributos: o algoritmo da Vertex AI Search for Retail seleciona até 20 atributos personalizados mais importantes para cada varejista.
  • Benefícios:maior precisão na classificação usando informações adicionais sobre os produtos, como códigos de venda e especificações do produto ou estilo.
  • Visibilidade: os varejistas podem conferir os atributos personalizados selecionados e garantir que eles sejam mantidos e atualizados.
  • Personalização e aprendizado: os clientes podem identificar padrões em atributos personalizados selecionados e adicionar outros relevantes para melhorar ainda mais a performance do ranking.

Como conferir quais atributos estão sendo usados

Se um cliente tiver os níveis mais altos ativados com pontos de dados de eventos do usuário suficientes, as novas informações dos atributos personalizados vão ficar visíveis no console, listadas na guia Pesquisa de texto e/ou Pesquisa de navegação na página Qualidade dos dados da Pesquisa para varejo. Aqui, você vai saber quais atributos personalizados foram escolhidos pelo sistema da Vertex AI para Pesquisa para varejo.

Texto alternativo

O que fazer com os atributos personalizados

  • Mantenha e não exclua nem descontinue atributos escolhidos, porque isso pode afetar o modelo.
  • Melhorar a cobertura de atributos selecionados automaticamente, preenchendo esses campos para mais produtos
  • Analise as tendências em que os atributos personalizados são selecionados automaticamente. Se você tiver outros atributos semelhantes, adicione-os ao seu catálogo. Elas vão se tornar candidatas à seleção pelo algoritmo de pesquisa de recursos.
  • Faça anotações corretas em atributos numéricos atribuindo valores numéricos em vez de valores de string. Por exemplo, forneça um valor numérico de 10.5, em vez de texto ("10,5").

Desativar a personalização

Para desativar a personalização, defina ServingConfig.personalizationSpec como mode.DISABLED.

Alertas de qualidade de dados

Os alertas de qualidade de dados são acionados quando um valor de métrica no painel muda de "satisfatório" para "não satisfatório". Os alertas são enviados por e-mail.

Se você quiser ver alertas relacionados ao Cloud Monitoring, acesse Configurar alertas.

Ver a qualidade dos dados

  1. Acesse a página Qualidade dos dados no console da Pesquisa para varejo.

    Acesse a página "Qualidade dos dados"

  2. Analisar linhas, métricas e alertas: uma linha corresponde a uma métrica, e uma métrica corresponde a um alerta.

Configurar alertas de qualidade de dados

REST

Chame a API UpdateAlertConfig.

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "ENROLLED",
      "recipients": [
        {
          "emailAddress": "EMAIL_ADDRESS_1"
        },
        {
          "emailAddress": "EMAIL_ADDRESS_2"
        }
      ]
    }
  ]
}'

Substitua:

  • PROJECT_ID: o ID do projeto do Google Cloud.
  • EMAIL_ADDRESS_1, EMAIL_ADDRESS_2: os endereços de e-mail que você quer inscrever nos alertas. Eles precisam ser compatíveis com SMTP. É possível adicionar até 20 endereços de e-mail a uma política de alerta.

Console

  1. Acesse a página Qualidade dos dados no console da Pesquisa para varejo.

    Acesse a página "Qualidade dos dados"

  2. Na parte de cima, clique em Configurar alertas.

  3. Adicione pelo menos um endereço de e-mail. Os endereços de e-mail precisam ser compatíveis com o SMTP (Simple Mail Transfer Protocol). É possível adicionar até 20 endereços de e-mail a uma política de alerta.

  4. Clique em Enviar.

Desativar alertas de qualidade de dados

REST

Chame a API UpdateAlertConfig.

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "DECLINED",
      "recipients": [
      ]
    }
  ]
}'

Substitua:

  • PROJECT_ID: o ID do projeto do Google Cloud.

Console

  1. Acesse a página Qualidade dos dados no console da Pesquisa para varejo.

    Acesse a página "Qualidade dos dados"

  2. Clique em Configurar alertas.

  3. Exclua todos os e-mails.

  4. Clique em Enviar.

Resolver problemas

Confira como resolver os seguintes problemas comuns.

A verificação de dados não está sendo aprovada

Se uma verificação de dados não for aprovada, clique em Detalhes para ver uma descrição mais detalhada da métrica e os limites que precisam ser atendidos para satisfazer essa verificação.

Se você já cumpriu os requisitos de dados, verifique a seção Carimbo de data/hora para saber quando a métrica foi calculada pela última vez. Se você reformulou ou incorporou recentemente uma quantidade significativa de dados, pode levar várias horas para recalcular essa métrica.

Se você não atender aos requisitos de dados, talvez seja necessário reformatar ou coletar mais dados para atender aos requisitos de verificação de dados. Depois de garantir que seus dados atendam ao limite da métrica, importe novamente os dados reformulados ou importe outros dados e aguarde o reprocessamento da métrica.

Um valor de métrica marcado como N/A

Os valores das métricas são mostrados como "N/A" se nenhum dado foi enviado ou se as métricas ainda não foram calculadas. Pode levar até 24 horas após a importação de dados para calcular algumas verificações de dados.

O nível de desempenho não tem problemas de bloqueio, mas não está em uso

Para resolver o problema, siga estas etapas:

  1. Verifique se há algum problema de dados de bloqueio para níveis anteriores. É necessário atender aos requisitos de todos os níveis anteriores para fazer upgrade para o próximo.

  2. Aguarde 24 horas. Depois que todas as verificações de dados de bloqueio de upgrade forem concluídas, serão necessárias cerca de 24 horas para treinar e preparar o modelo e ativar o nível recém-desbloqueado.

Se o nível de performance não for marcado como em uso em até dois dias após passar em todas as verificações de dados de bloqueio de upgrade, entre em contato com o suporte da Vertex AI para Pesquisa para varejo com o número e o ID do projeto para receber ajuda.

Outras informações sobre requisitos de dados

Para saber mais sobre os requisitos de dados da Vertex AI para Pesquisa para varejo, consulte a documentação:

A seguir