Importar dados de preenchimento automático para a pesquisa

O preenchimento automático é um recurso para prever o restante de uma palavra que um usuário está digitando, o que pode melhorar a experiência de pesquisa do usuário. Ele pode fazer sugestões com base no conjunto de dados fornecido ou nos eventos de usuário.

Importe dados de preenchimento automático apenas se quiser ter controles adicionais (lista "Não remover", lista "Negar") ou se precisar usar seus próprios dados de preenchimento automático. Ativar o aprendizado automático é suficiente para a maioria dos casos em que o preenchimento automático é necessário. O aprendizado automático fornece um conjunto de dados de sugestões com base no aprendizado de máquina com base nos eventos de pesquisa do usuário. Consulte Preenchimento automático para saber como ativar o aprendizado automático.

Estas instruções servem apenas para fazer upload dos seus próprios dados de preenchimento automático. Mantenha-o atualizado se você planeja usar seu conjunto de dados de preenchimento automático o tempo todo. Para receber resultados de preenchimento automático no momento da consulta, consulte CompletionService.CompleteQuery. Os dados de preenchimento automático são usados apenas para pesquisa. Esses dados não são usados pelas recomendações.

Antes de começar

Antes de importar suas informações de preenchimento automático, é preciso concluir as instruções em Antes de começar, especificamente como configurar seu projeto, como criar uma conta de serviço e como adicionar a conta de serviço ao seu ambiente local.

É necessário ter o papel do IAM de Editor de varejo para realizar a importação.

Práticas recomendadas para importação de preenchimento automático

Ao importar dados de preenchimento automático, implemente as seguintes práticas recomendadas:

  • Leia o esquema do BigQuery listado nas seções e na documentação da API.

  • Não use valores de marcador.

  • Inclua o maior número possível de campos.

  • Mantenha seu próprio conjunto de dados de preenchimento automático atualizado se você planeja usá-lo.

  • A importação de dados de outro projeto não é permitida.

Importar dados de preenchimento automático

Importar dados de preenchimento automático do BigQuery

A Vertex AI Search para varejo oferece suporte à importação de dados do BigQuery para a lista de recusa, a lista de não remoção e a lista de termos de sugestão. Confira mais detalhes em Preenchimento automático.

Para importar dados de preenchimento automático no formato correto do BigQuery, use o esquema de preenchimento automático do Search for Retail da Vertex AI para criar uma tabela do BigQuery com o formato correto e carregue a tabela com seus dados de preenchimento automático. Em seguida, faça o upload dos seus dados para a Vertex AI para Pesquisa para varejo.

Para mais ajuda com as tabelas do BigQuery, consulte Introdução às tabelas. Para ajuda com as consultas do BigQuery, consulte Visão geral da consulta de dados do BigQuery.

Local do conjunto de dados do BigQuery

Ao criar o conjunto de dados do BigQuery para as tabelas de preenchimento automático do BigQuery, verifique se o local do conjunto de dados está definido como o local multirregional "US". Se você não definir corretamente, a solicitação de importação vai falhar mais tarde. Para saber mais sobre os locais de conjuntos de dados do BigQuery, consulte Locais de conjuntos de dados na documentação do BigQuery.

Preencher dados no BigQuery

Use o esquema de preenchimento automático do Search for Retail da Vertex AI para fazer upload dos dados de preenchimento automático para o BigQuery.

O BigQuery pode usar o esquema para validar se os dados formatados em JSON têm nomes e tipos de campo corretos (como STRING, INTEGER e RECORD), mas não podem realizar validações como determinando:

  • se um campo de string foi mapeado para um valor de enumeração reconhecível;
  • se um campo de string está usando o formato correto;
  • se um campo de número inteiro ou flutuante tem valor em um intervalo válido;
  • se um campo ausente é obrigatório.

Para garantir a qualidade dos seus dados e da experiência de pesquisa do usuário final, consulte a documentação de esquema e referência para detalhes sobre valores e formato.

Configurar o acesso ao conjunto de dados do BigQuery

Para configurar o acesso, verifique se o conjunto de dados do BigQuery está no mesmo projeto que o serviço de pesquisa da Vertex AI para varejo e siga as etapas a seguir.

  1. Abra a página "IAM" no console do Google Cloud.

    Abrir a página do IAM

  2. Selecione seu projeto da Vertex AI para Pesquisa para varejo.

  3. Na página IAM e administrador, clique em  Conceder acesso.

  4. Em Novos administradores, digite cloud-retail-customer-data-access@system.gserviceaccount.com e selecione o papel BigQuery > Visualizador de dados do BigQuery.

    Se você não quiser fornecer o papel de visualizador de dados a todo o projeto, adicione esse papel diretamente ao conjunto de dados. Saiba mais.

  5. Clique em Salvar.

Acionar a importação de dados para a Vertex AI para Pesquisa para varejo

Console

  1. Acessar a página "Controles"

  2. Acesse a guia Controles de preenchimento automático.

  3. Na seção Listas de termos, encontre o tipo de lista que você quer importar (Lista de negação, Lista de não remoção ou Lista de termos sugeridos) e clique em Importar ou Substituir.

    O painel Importar é aberto.

  4. Insira o caminho do BigQuery do local dos dados ou selecione Procurar para selecionar o local.

    O caminho do BigQuery precisa estar no mesmo projeto, e o esquema dele precisa estar correto. Para verificar isso, clique em Procurar e no nome da tabela para conferir o conteúdo dela no console do BigQuery.

  5. No painel Import, clique em Import.

    A importação começa. Você pode sair da página sem interromper a importação.

cURL

  1. Crie um arquivo de dados para os parâmetros de entrada para a importação. Os valores do parâmetro de entrada dependem da importação do Cloud Storage ou do BigQuery.

    Use o objeto BigQuerySource para apontar para o conjunto de dados do BigQuery.

    {
      "inputConfig":{
        "bigQuerySource": {
          "datasetId":"dataset-id",
          "tableId":"table-id",
          "dataSchema":"data-schema"
        }
      }
    }
  2. Importe as informações de preenchimento automático para a Vertex AI para Pesquisa para o varejo fazendo uma solicitação POST para o método REST CompletionData:import, fornecendo o nome do arquivo de dados (mostrado como input.json no exemplo abaixo).

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" -d @./input.json
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionData:import"

    É possível verificar o status de maneira programática usando a API. Você receberá um objeto de resposta com esta aparência:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "done": false
    }

    O campo de nome é o ID do objeto de operação. Para solicitar o status desse objeto, substitua o campo de nome pelo valor retornado pelo método de importação. Quando a importação for concluída, o campo done será retornado como true:

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456"

    Quando a operação for concluída, o objeto retornado terá um valor done de true e incluirá um objeto Status semelhante ao exemplo a seguir:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportMetadata",
        "createTime": "2020-01-01T03:33:33.000001Z",
        "updateTime": "2020-01-01T03:34:33.000001Z",
        "successCount": "2",
        "failureCount": "1"
      },
      "done": true
      "response": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportCompletionDataResponse",
      }
    }

Formato de dados de preenchimento automático

O arquivo JSON será semelhante aos exemplos a seguir. As quebras de linha são para facilitar a leitura. Você deve fornecer uma sugestão inteira em uma única linha. Cada sugestão precisa estar em uma linha.

Campos obrigatórios mínimos da sugestão:

{
  "suggestion": "ABC",
  "globalScore": "0.5"
}

Ou:

{
  "suggestion": "ABC",
  "frequency": "100"
}

Duração da importação de dados de preenchimento automático

Geralmente, leva de alguns minutos a uma hora para que uma importação do BigQuery seja concluída.

Quando a importação do conjunto de dados for concluída, o campo done no objeto de operação será marcado como verdadeiro. Depois disso, pode levar de um a dois dias para que os dados sejam indexados e usados na veiculação de produção.

Mantenha seu conjunto de dados de preenchimento automático atualizado

Se você planeja usar seu próprio conjunto de dados enviado, a prática recomendada é mantê-lo atualizado regularmente.

Atualização em lote

Você pode usar o método de importação para atualizar o preenchimento automático em lote. Isso é feito da mesma maneira que a importação inicial. Siga as etapas em Como importar dados de preenchimento automático. Isso substituirá todo o conjunto de dados importado.

Monitorar a integridade da importação

É importante manter seu próprio conjunto de dados atualizado para conseguir resultados de sugestão de alta qualidade ao usá-lo. Monitore as taxas de erro de importação e tome as medidas necessárias.

Esquema de preenchimento automático da Vertex AI para Pesquisa para varejo

Ao importar um conjunto de dados de preenchimento automático do BigQuery, use o esquema do Search for Retail da Vertex AI abaixo para criar tabelas do BigQuery com o formato correto e carregá-las com os dados de preenchimento automático.

Esquema de sugestões

Esse conjunto de dados é usado para fornecer suas próprias frases de sugestão de preenchimento automático com suas próprias pontuações.

Esquema para a lista de bloqueio

Esse conjunto de dados é usado como uma lista de bloqueio para impedir que frases sejam sugeridas.

Esquema para colocar na lista de permissões

Esse conjunto de dados é usado para pular processos de postagem, como correção ortográfica e filtragem de resultados nulos, para todas as frases nesta lista de permissões.