Importar dados de preenchimento automático para a pesquisa

O preenchimento automático é um recurso para prever o restante de uma palavra que um usuário está digitando, o que pode melhorar a experiência de pesquisa do usuário. Ele pode fazer sugestões com base no conjunto de dados fornecido ou nos eventos de usuário.

Considere importar dados de preenchimento automático apenas se você quiser ter mais (Não remover lista, lista de bloqueio) ou se precisar usar seus próprios controles dados de preenchimento automático. Ativar o aprendizado automático é suficiente para a maioria dos casos em que o preenchimento automático é necessário. O aprendizado automático fornece um conjunto de dados de sugestões com base no aprendizado de máquina com base nos eventos de pesquisa do usuário. Consulte Preenchimento automático para saber como ativar o aprendizado automático.

Estas instruções se destinam ao upload do seu próprio recurso de preenchimento automático. apenas com dados. Mantenha-o atualizado se você planeja usar seu conjunto de dados de preenchimento automático o tempo todo. Para receber resultados de preenchimento automático no momento da consulta, consulte CompletionService.CompleteQuery. Os dados de preenchimento automático são usados apenas para pesquisa. Esses dados não são usados pelo recomendações.

Antes de começar

Antes de importar suas informações de preenchimento automático, é preciso concluir as instruções em Antes de começar, especificamente como configurar seu projeto, como criar uma conta de serviço e como adicionar a conta de serviço ao seu ambiente local.

É necessário ter o papel do IAM de Editor de varejo para realizar a importação.

Práticas recomendadas para importação de preenchimento automático

Ao importar dados de preenchimento automático, implemente as seguintes práticas recomendadas:

  • Leia o esquema do BigQuery listado a seguir seções e documentação da API.

  • Não use valores de marcador.

  • Inclua o maior número possível de campos.

  • Mantenha seu próprio conjunto de dados de preenchimento automático atualizado se você planeja usá-lo.

  • A importação de dados de outro projeto não é permitida.

Importar dados de preenchimento automático

Importar dados de preenchimento automático do BigQuery

A Vertex AI para Pesquisa para Retail oferece suporte à importação de dados do BigQuery para Negar List, Não Remover Lista e Lista de Termos de Sugestão. Confira mais detalhes em Preenchimento automático.

Para importar dados de preenchimento automático no formato correto do BigQuery, use o esquema de preenchimento automático do Search for Retail da Vertex AI para criar uma tabela do BigQuery com o formato correto e carregue a tabela com seus dados de preenchimento automático. Em seguida, faça o upload para a Vertex AI para Pesquisa para Retail.

Para mais ajuda com as tabelas do BigQuery, consulte Introdução às tabelas. Para ajuda com as consultas do BigQuery, consulte Visão geral da consulta de dados do BigQuery.

Local do conjunto de dados do BigQuery

Ao criar o conjunto de dados do BigQuery para as tabelas de preenchimento automático do BigQuery, verifique se o local do conjunto de dados está definido como o local multirregional "US". Configuração incorreta causará uma falha na solicitação de importação. Para saber mais sobre os locais de conjuntos de dados do BigQuery, consulte Locais de conjuntos de dados na documentação do BigQuery.

Preencher dados no BigQuery

Usar o esquema de preenchimento automático da Vertex AI para Pesquisa para varejo para: fazer o upload dos dados de preenchimento automático no BigQuery.

O BigQuery pode usar o esquema para validar se os dados formatados em JSON têm nomes e tipos de campo corretos (como STRING, INTEGER e RECORD), mas não podem realizar validações como determinando:

  • se um campo de string foi mapeado para um valor de enumeração reconhecível;
  • se um campo de string está usando o formato correto;
  • se um campo de número inteiro ou flutuante tem valor em um intervalo válido;
  • se um campo ausente é obrigatório.

Para garantir a qualidade dos seus dados e da experiência de pesquisa do usuário final, consulte a documentação de esquema e referência para detalhes sobre valores e formato.

Configurar o acesso ao seu conjunto de dados do BigQuery

Para configurar o acesso, verifique se o conjunto de dados do BigQuery está no mesmo projeto que o serviço de pesquisa da Vertex AI para varejo e siga as etapas a seguir.

  1. Abra a página "IAM" no console do Google Cloud.

    Abrir a página do IAM

  2. Selecione seu projeto da Vertex AI para Pesquisa para varejo.

  3. Na página IAM e "Administrador", clique em  Conceda acesso.

  4. Em Novos administradores, digite cloud-retail-customer-data-access@system.gserviceaccount.com e selecione o papel BigQuery > Visualizador de dados do BigQuery.

    Se você não quiser fornecer o papel de visualizador de dados a todo o projeto, adicione esse papel diretamente ao conjunto de dados. Saiba mais.

  5. Clique em Salvar.

Acionar a importação de dados para a Vertex AI para Pesquisa para Retail

Console

  1. Acessar a página "Controles"

  2. Acesse a guia Controles de preenchimento automático.

  3. Na seção Term Lists, encontre o tipo de lista que você planeja importar. (Lista de bloqueio, Lista "Não remover" ou Lista de termos sugeridos) e Clique em Importar ou Substituir.

    O painel Importar será aberto.

  4. Insira o caminho do BigQuery do local dos dados ou selecione Procurar para selecionar o local.

    O caminho do BigQuery precisa estar no mesmo projeto esquema deve estar correto. Para verificar isso, clique em Procurar e no nome da tabela para conferir o conteúdo dela no console do BigQuery.

  5. No painel Import, clique em Import.

    A importação começa. É possível sair da página sem interromper a importação.

cURL

  1. Crie um arquivo de dados para os parâmetros de entrada para a importação. Os valores do parâmetro de entrada dependem da importação do Cloud Storage ou do BigQuery.

    Use o objeto BigQuerySource para apontar para o conjunto de dados do BigQuery.

    {
      "inputConfig":{
        "bigQuerySource": {
          "datasetId":"dataset-id",
          "tableId":"table-id",
          "dataSchema":"data-schema"
        }
      }
    }
  2. Importe suas informações de preenchimento automático para a Vertex AI para Pesquisa para Retail fazendo uma solicitação POST ao Método REST CompletionData:import, fornecendo o nome do arquivo de dados (mostrado como input.json no exemplo abaixo).

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" -d @./input.json
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionData:import"

    É possível verificar o status de maneira programática usando a API. Você receberá um objeto de resposta com esta aparência:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "done": false
    }

    O campo de nome é o ID do objeto de operação. Para solicitar o status desse objeto, substitua o campo de nome pelo valor retornado pelo método de importação. Quando a importação estiver concluída, o O campo done retorna como true:

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456"

    Quando a operação for concluída, o objeto retornado terá um valor done de true e incluirá um objeto Status semelhante ao exemplo a seguir:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportMetadata",
        "createTime": "2020-01-01T03:33:33.000001Z",
        "updateTime": "2020-01-01T03:34:33.000001Z",
        "successCount": "2",
        "failureCount": "1"
      },
      "done": true
      "response": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportCompletionDataResponse",
      }
    }

Formato de dados de preenchimento automático

O arquivo JSON será semelhante aos exemplos a seguir. As quebras de linha são para facilitar a leitura. Você deve fornecer uma sugestão inteira em uma única linha. Cada sugestão precisa estar em uma linha.

Campos obrigatórios mínimos da sugestão:

{
  "suggestion": "ABC",
  "globalScore": "0.5"
}

Ou:

{
  "suggestion": "ABC",
  "frequency": "100"
}

Duração da importação de dados de preenchimento automático

Geralmente, leva de alguns minutos a uma hora para uma importação de BigQuery para concluir.

Quando a importação do conjunto de dados for concluída, o campo done na O objeto da operação está marcado como verdadeiro. Depois disso, pode levar de um a dois dias para que os dados sejam indexados e usados. na veiculação em produção.

Mantenha seu conjunto de dados de preenchimento automático atualizado

Se você planeja usar o conjunto de dados do qual foi feito o upload, a prática recomendada é mantê-lo atualizado regularmente.

Atualização em lote

Você pode usar o método de importação para atualizar em lote o preenchimento automático. Você faz isso da mesma forma que você faz a importação inicial. siga as etapas Importar dados de preenchimento automático. Isso substituirá todo o conjunto de dados importado.

Monitorar a integridade da importação

É importante manter seu próprio conjunto de dados atualizado para conseguir resultados de sugestão de alta qualidade ao usá-lo. Monitore as taxas de erro de importação e tome as medidas necessárias.

Esquema de preenchimento automático da Vertex AI para Pesquisa para Retail

Ao importar o conjunto de dados de preenchimento automático do BigQuery, use o Esquema da Vertex AI para Pesquisa para Retail para criar Tabelas do BigQuery com o formato correto e carregá-las com seus dados de preenchimento automático.

Esquema de sugestões

Esse conjunto de dados é usado para fornecer suas próprias frases de sugestão de preenchimento automático com suas próprias pontuações.

Esquema para a lista de bloqueio

Esse conjunto de dados é usado como uma lista de bloqueio para impedir que frases sejam sugeridas.

Esquema para colocar na lista de permissões

Esse conjunto de dados é usado para pular processos de postagem, como correção ortográfica e filtragem de resultados nulos, para todas as frases nesta lista de permissões.