Preparar dados com o Gemini
Este documento descreve como gerar e gerenciar sugestões de código SQL para suas preparações de dados no BigQuery.
Para mais informações, consulte Introdução ao preparo de dados do BigQuery.
Antes de começar
Abrir o editor de preparo de dados no BigQuery
Para abrir o editor de preparação de dados no BigQuery, crie uma nova preparação de dados, crie uma a partir de uma tabela existente ou abra uma preparação de dados existente. Para mais informações sobre o que acontece quando você cria uma preparação de dados, consulte Pontos de entrada da preparação de dados.
Na página do BigQuery Studio, é possível acessar o editor de preparação de dados das seguintes maneiras:
Criar novo
Para criar uma nova preparação de dados no BigQuery, siga estas etapas:
- No console do Google Cloud, acesse a página BigQuery Studio.
Acessar o BigQuery - Acesse a lista Criar novo e clique em Preparação de dados. O editor de preparação de dados é exibido em uma nova guia de preparação de dados sem título.
- Na barra de pesquisa do editor, digite o nome da tabela ou as palavras-chave e
selecione uma tabela. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos seus dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
Um recurso de Preparação de dados aparece no painel Explorador, onde você pode acessar essa preparação no futuro. - Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Criar nova tabela
Para criar uma nova preparação de dados com base em uma tabela existente, siga estas etapas:
- No console do Google Cloud, acesse a página BigQuery Studio.
Acessar o BigQuery - No painel Explorer, mantenha o ponteiro sobre uma tabela.
- Clique em more_vert
Menu > Consulta em > Preparação de dados. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos seus dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
Um recurso de Preparação de dados aparece no painel Explorador, onde você pode acessar essa preparação no futuro. - Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Abrir
Para abrir o editor de uma preparação de dados existente, siga estas etapas:
- No console do Google Cloud, acesse a página BigQuery Studio.
Acessar o BigQuery - No painel Explorer, clique no nome do projeto e em Preparação de dados.
- Selecione a preparação de dados atual. A visualização em gráfico do pipeline de preparação de dados é mostrada.
- Selecione um dos nós no gráfico. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
- Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Criar etapas de preparação de dados
Você prepara os dados em etapas. É possível visualizar ou aplicar as etapas sugeridas pelo Gemini. Você também pode ajustar as sugestões ou aplicar suas próprias etapas. Para mais informações sobre as etapas de preparação de dados aceitas, consulte Etapas aceitas.
Conferir, editar e aplicar sugestões do Gemini
Quando você abre o editor de preparação de dados da tabela nas etapas anteriores, o Gemini inspeciona os dados e o esquema da tabela carregada e gera sugestões.
Ao conferir os dados na visualização de dados, clique no nome de uma coluna ou em uma célula específica. O Gemini gera sugestões de filtro e transformação específicas para essa coluna ou célula.
Aplique uma sugestão do Gemini como uma etapa de preparação de dados:
- Na visualização de dados, acesse a lista Etapas e analise as sugestões.
- Opcional: para conferir o resultado do card de sugestão, clique em Visualizar.
Opcional: para modificar o card de sugestão usando linguagem natural, clique em Editar.
Para mais informações sobre como modificar sugestões, consulte Melhorar sugestões com um exemplo e Adicionar etapas com linguagem natural ou expressões SQL.
Clique em Aplicar.
Navegar pela lista de etapas
É possível realizar as seguintes ações na visualização de dados ao clicar em Ações aplicadas e inspecionar a lista de ações:
- Edite ou remova uma etapa da lista clicando no more_vert Menu e fazendo a alteração.
- Selecione qualquer etapa na lista para conferir o exemplo de dados e o esquema a partir dessa etapa específica.
- Selecione uma etapa na lista para inserir novas etapas depois da selecionada.
Melhorar as sugestões com um exemplo
Para ajustar as sugestões do Gemini, dê um exemplo de como os dados devem ficar na célula:
Na visualização de dados, edite os valores de uma a três células para demonstrar como os valores dessa coluna devem ficar. Por exemplo, insira uma data da maneira que você quer formatar todas as datas. O Gemini gera novas sugestões com base nas suas mudanças.
Para modificar um card de sugestão, clique em Editar.
Clique em Aplicar.
Adicionar etapas com linguagem natural ou expressões SQL
Se nenhuma sugestão atender às suas necessidades, adicione a sua própria etapa clicando em Adicionar etapa, selecionando um tipo de etapa e inserindo um comando em linguagem natural que descreva sua intenção.
Adicionar uma transformação
- Na visualização de dados, clique em Adicionar etapa e escolha a opção Transformação.
- No campo Descrição, insira um comando, como
Convert the state column to a uppercase
. Clique em enviar Enviar.
O Gemini gera uma expressão SQL e uma nova descrição com base no comando.
Na lista Coluna de destino, selecione ou insira um nome de coluna.
Opcional: para atualizar a expressão SQL, revise o comando e clique em enviar Enviar ou insira manualmente uma expressão SQL.
Opcional: clique em Visualizar e revise a etapa.
Clique em Aplicar.
Filtrar linhas
Para adicionar um filtro que remova linhas, siga estas etapas:
- Na visualização de dados, clique em Adicionar etapa > Filtro.
- No campo Descrição, digite um comando, como
Column ID should not be NULL
. - Clique em Gerar. O Gemini gera uma expressão SQL e uma nova descrição com base no comando.
- Opcional: para atualizar a expressão SQL, revise o comando e clique em enviar Enviar ou insira uma expressão SQL manualmente.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
Formato da expressão do filtro
As expressões SQL para filtros retêm as linhas que correspondem à condição especificada. Isso
é equivalente a uma instrução
SELECT … WHERE SQL_EXPRESSION
.
Por exemplo, para manter registros em que a coluna year
é maior ou igual
a 2000
, a condição é year >= 2000
.
As expressões precisam seguir a sintaxe SQL do BigQuery para a
cláusula WHERE
.
Configurar a tabela de erros e adicionar uma regra de validação
É possível adicionar um filtro que cria uma regra de validação, que envia erros para uma tabela de erros ou falha na execução da preparação de dados.
Configurar a tabela de erros
Para configurar a tabela de erros, siga estas etapas:
- Na visualização de dados, acesse a barra de ferramentas e clique em Mais > Tabela de erros.
- Clique em Ativar tabela de erros.
- Defina o local da tabela.
- Opcional: defina uma duração máxima para manter erros.
- Clique em Salvar.
Adicionar uma regra de validação
Para adicionar uma regra de validação, siga estas etapas:
- Na visualização de dados, clique em Adicionar etapa > Filtro.
- Insira uma descrição para a etapa.
- Insira uma expressão SQL na forma de uma cláusula
WHERE
. - Opcional: se você quiser que a expressão SQL funcione como uma regra de validação, selecione a caixa de seleção As linhas de validação com falhas vão para a tabela de erros. Também é possível mudar um filtro para uma validação na barra de ferramentas de preparação de dados clicando em Mais > Tabela de erros.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
Excluir uma coluna
Para excluir uma coluna de uma preparação de dados, siga estas etapas:
- Na visualização de esquema, clique em more_vert Menu ao lado da coluna a ser excluída.
- Clique em Excluir. Uma nova etapa aplicada é adicionada à coluna excluída.
Adicionar uma operação de mesclagem com o Gemini
Para adicionar uma etapa de operação de mesclagem entre duas fontes no preparo de dados, siga estas etapas:
- Na visualização de dados de um nó na preparação de dados, acesse a lista Steps e clique em Add step > Join.
- Na caixa de diálogo Add join, clique em Browse e selecione a outra tabela envolvida na operação de mesclagem (chamada de lado direito da mesclagem).
- Opcional: selecione o tipo de operação de união que você quer realizar, como União interna.
Analise as informações da chave de mesclagem gerada pelo Gemini nos seguintes campos:
- Descrição da mesclagem: a descrição em linguagem natural da expressão SQL para a operação de mesclagem. Quando você edita essa descrição e clicar em enviar enviar, o Gemini sugere novas condições de mesclagem SQL.
Condições de mesclagem: as expressões SQL na cláusula
ON
para a operação de mesclagem. É possível usar os qualificadoresL
eR
para se referir às tabelas de origem esquerda e direita, respectivamente. Por exemplo, para mesclar a colunacustomer_id
da tabela à esquerda com a colunacustomer_id
da tabela à direita, digiteL.customerId = R.customerId
. Esses qualificadores não diferenciam maiúsculas de minúsculas.
Opcional: para refinar as sugestões do Gemini, edite o campo Descrição da união e clique em Enviar Enviar.
Opcional: para conferir uma prévia das configurações da operação de mesclagem do seu preparo de dados, clique em Visualizar.
Clique em Aplicar.
A etapa de operação de união é criada. A tabela de origem selecionada (o lado direito da mesclagem) e a operação de mesclagem são refletidas na lista de etapas aplicadas e nos nós na visualização de gráfico da preparação de dados.
Adicionar ou mudar uma tabela de destino
Para adicionar ou mudar uma tabela de destino para a saída da preparação de dados, siga estas etapas:
- Na visualização de dados, clique em Adicionar > Destino.
- Selecione o projeto em que a tabela de destino está armazenada.
- Selecione um dos conjuntos de dados ou carregue um novo.
- Insira uma tabela de destino. Se a tabela não existir, a preparação de dados vai criar uma nova na primeira execução. Para mais informações, consulte Modo de gravação.
- Selecione seu conjunto de dados como o destino.
- Clique em Salvar.
Executar a preparação de dados
Depois de adicionar as etapas de preparação de dados, configurar o destino e corrigir os erros de validação, você pode realizar execuções de teste em uma amostra dos dados ou implantar as etapas e programar execuções de preparação de dados. Para mais informações, consulte Programar preparações de dados.
Atualizar amostras de preparação de dados
Os dados da amostra não são atualizados automaticamente. Se os dados nas tabelas de origem para a preparação de dados tiverem mudado, mas as mudanças não forem refletidas na amostra de dados da preparação, clique em Mais > Atualizar amostra.
A seguir
- Saiba como programar preparações de dados.
- Saiba mais sobre como gerenciar a preparação de dados.
- Saiba mais sobre cotas e limites do Gemini no BigQuery.
- Consulte os preços do Gemini no BigQuery.