Importar dados de preenchimento automático para pesquisa

O preenchimento automático é um recurso para prever o restante de uma palavra que um usuário está digitando, o que pode melhorar a experiência de pesquisa dele. Ele pode fazer sugestões com base no conjunto de dados fornecido ou nos eventos de usuário.

Considere importar dados de preenchimento automático apenas se quiser ter mais controles (não remover lista, lista de bloqueio) ou se precisar usar seus próprios dados de preenchimento automático. Ativar o aprendizado automático é suficiente para a maioria dos casos em que o preenchimento automático é necessário. O aprendizado automático fornece um conjunto de dados de sugestões com base em eventos de pesquisa do usuário. Consulte Preenchimento automático para saber como ativar o aprendizado automático.

Estas instruções são para fazer upload apenas dos seus próprios dados de preenchimento automático. Mantenha-o atualizado se planeja usar o conjunto de dados de preenchimento automático o tempo todo. Para receber resultados de preenchimento automático no momento da consulta, consulte CompletionService.CompleteQuery. Os dados do preenchimento automático são usados apenas para pesquisa. Esses dados não são usados por recomendações.

Antes de começar

Antes de importar suas informações de preenchimento automático, conclua as instruções em Antes de começar, especificamente como configurar o projeto, criar uma conta de serviço e adicionar a conta de serviço ao ambiente local.

Você precisa ter o papel de Editor de varejo do IAM para realizar a importação.

Práticas recomendadas de importação do preenchimento automático

Ao importar dados de preenchimento automático, implemente as seguintes práticas recomendadas:

  • Leia o esquema do BigQuery listado nas seções e na documentação da API a seguir.

  • Não use valores de marcador.

  • Inclua o maior número possível de campos.

  • Mantenha seu conjunto de dados de preenchimento automático atualizado se planeja usar seu próprio conjunto de dados enviado.

  • Não é permitido importar dados de outro projeto.

Importar dados de preenchimento automático

Importar dados de preenchimento automático do BigQuery

A Vertex AI para Pesquisa para Retail é compatível com a importação de dados do BigQuery para lista de negação, lista de não remoção e lista de termos de sugestão. Confira mais detalhes em Autocomplete.

Para importar dados de preenchimento automático no formato correto do BigQuery, use o esquema de preenchimento automático da Vertex AI para Pesquisa para varejo para criar uma tabela do BigQuery com o formato correto e carregar a tabela com seus dados de preenchimento automático. Em seguida, faça upload dos dados para a Vertex AI para Pesquisa para Retail.

Para mais ajuda com as tabelas do BigQuery, consulte Introdução às tabelas. Para ajuda com as consultas do BigQuery, consulte Visão geral da consulta de dados do BigQuery.

Local do conjunto de dados do BigQuery

Ao criar o conjunto de dados do BigQuery para suas tabelas de preenchimento automático do BigQuery, verifique se o local do conjunto de dados está definido como o local multirregional "US". Se ela não for definida corretamente, a solicitação de importação vai falhar mais tarde. Para saber mais sobre os locais de conjuntos de dados do BigQuery, consulte Locais de conjuntos de dados na documentação do BigQuery.

Preencher dados no BigQuery

Use o esquema de preenchimento automático da Vertex AI para Pesquisa para varejo para fazer upload dos dados para o BigQuery.

O BigQuery pode usar o esquema para validar se os dados formatados em JSON têm nomes e tipos de campo corretos (como STRING, INTEGER e RECORD), mas não podem realizar validações como determinando:

  • se um campo de string foi mapeado para um valor de enumeração reconhecível;
  • se um campo de string está usando o formato correto;
  • se um campo de número inteiro ou flutuante tem valor em um intervalo válido;
  • se um campo ausente é obrigatório.

Para garantir a qualidade dos seus dados e da experiência de pesquisa do usuário final, consulte a documentação de esquema e referência para detalhes sobre valores e formato.

Configurar o acesso ao conjunto de dados do BigQuery

Para configurar o acesso, verifique se o conjunto de dados do BigQuery está no mesmo projeto que o serviço da Vertex AI para Pesquisa para Retail e conclua as etapas a seguir.

  1. Abra a página "IAM" no console do Google Cloud.

    Abrir a página do IAM

  2. Selecione seu projeto da Vertex AI para Pesquisa para Retail.

  3. Na página IAM e administrador, clique em  Conceder acesso.

  4. Em Novos principais, insira cloud-retail-customer-data-access@system.gserviceaccount.com e selecione o papel BigQuery > Leitor de dados do BigQuery.

    Se você não quiser fornecer o papel de visualizador de dados a todo o projeto, adicione esse papel diretamente ao conjunto de dados. Saiba mais.

  5. Clique em Salvar.

Acionar a importação de dados para a Vertex AI para Pesquisa para Retail

Console

  1. Acessar a página "Controles"

  2. Acesse a guia Controles de preenchimento automático.

  3. Na seção Listas de termos, encontre o tipo de lista que você planeja importar (Lista de bloqueio, Lista de não remover ou Lista de termos sugeridos) e clique em Importar ou Substituir.

    O painel Importar será aberto.

  4. Insira o caminho do BigQuery do local dos dados ou selecione Procurar para selecionar o local.

    O caminho do BigQuery precisa estar no mesmo projeto e o esquema precisa estar correto. Para verificar isso, clique em Procurar e no nome da tabela para exibir o conteúdo dela no console do BigQuery.

  5. No painel Importar, clique em Importar.

    A importação será iniciada. É possível sair da página sem interromper a importação.

cURL

  1. Crie um arquivo de dados para os parâmetros de entrada para a importação. Os valores do parâmetro de entrada dependem da importação do Cloud Storage ou do BigQuery.

    Use o objeto BigQuerySource para apontar para o conjunto de dados do BigQuery.

    {
      "inputConfig":{
        "bigQuerySource": {
          "datasetId":"dataset-id",
          "tableId":"table-id",
          "dataSchema":"data-schema"
        }
      }
    }
    
  2. Importe suas informações de preenchimento automático para a Vertex AI para Pesquisa para Retail fazendo uma solicitação POST ao método REST CompletionData:import, fornecendo o nome do arquivo de dados (mostrado como input.json no exemplo abaixo).

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" -d @./input.json
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionData:import"
    

    É possível verificar o status de maneira programática usando a API. Você receberá um objeto de resposta com esta aparência:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "done": false
    }
    

    O campo de nome é o ID do objeto de operação. Para solicitar o status desse objeto, substitua o campo de nome pelo valor retornado pelo método de importação. Quando a importação for concluída, o campo done retornará como true:

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456"
    

    Quando a operação for concluída, o objeto retornado terá um valor done de true e incluirá um objeto Status semelhante ao exemplo a seguir:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportMetadata",
        "createTime": "2020-01-01T03:33:33.000001Z",
        "updateTime": "2020-01-01T03:34:33.000001Z",
        "successCount": "2",
        "failureCount": "1"
      },
      "done": true
      "response": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportCompletionDataResponse",
      }
    }
    

Formato de dados de preenchimento automático

O arquivo JSON será semelhante aos exemplos a seguir. As quebras de linha são para facilitar a leitura. Você deve fornecer uma sugestão inteira em uma única linha. Cada sugestão precisa estar em uma linha.

Campos obrigatórios mínimos da sugestão:

{
  "suggestion": "ABC",
  "globalScore": "0.5"
}

Ou:

{
  "suggestion": "ABC",
  "frequency": "100"
}

Duração da importação de dados com preenchimento automático

Geralmente, leva de alguns minutos a uma hora para que uma importação do BigQuery seja concluída.

Quando a importação do conjunto de dados for concluída, o campo done no objeto de operação será marcado como verdadeiro. Depois disso, pode levar mais um ou dois dias para que os dados sejam indexados e usados na exibição de produção.

Mantenha seu conjunto de dados de preenchimento automático atualizado

Se você planeja usar o conjunto de dados do qual foi feito o upload, a prática recomendada é mantê-lo atualizado regularmente.

Atualização em lote

Você pode usar o método de importação para atualizar em lote o preenchimento automático. Faça isso da mesma maneira que a importação inicial. Siga as etapas em Como importar dados de preenchimento automático. Isso substituirá todo o conjunto de dados importado.

Monitorar a integridade da importação

É importante manter seu próprio conjunto de dados atualizado para conseguir resultados de sugestão de alta qualidade ao usá-lo. Monitore as taxas de erro de importação e tome as medidas necessárias.

Esquema de preenchimento automático da Vertex AI para Pesquisa para Retail

Ao importar o conjunto de dados de preenchimento automático do BigQuery, use o esquema da Vertex AI para Pesquisa para Retail abaixo para criar tabelas do BigQuery com o formato correto e carregá-las com seus dados de preenchimento automático.

Esquema de sugestões

Esse conjunto de dados é usado para fornecer suas próprias frases de sugestão de preenchimento automático com suas próprias pontuações.

Esquema para a lista de bloqueio

Esse conjunto de dados é usado como uma lista de bloqueio para impedir que frases sejam sugeridas.

Esquema para colocar na lista de permissões

Esse conjunto de dados é usado para pular processos de postagem (como correção ortográfica e filtragem de resultado zero) para todas as frases nesta lista de permissões.