Usar o fluxo de alterações do Bigtable para o modelo do BigQuery
Neste guia de início rápido, você vai aprender a configurar uma tabela do Bigtable com um fluxo de alterações ativado, o pipeline do fluxo de alterações, fazer alterações na tabela e conferir as alterações transmitidos.
Antes de começar
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, Cloud Bigtable Admin API, and BigQuery APIs.
-
In the Google Cloud console, activate Cloud Shell.
Criar um conjunto de dados do BigQuery
Use o console do Google Cloud para criar um conjunto de dados que armazena os dados.
No console do Google Cloud, acesse a página do BigQuery.
No painel Explorer, clique no nome do seu projeto.
Expanda a opção
Ações e clique em Criar conjunto de dados.Na página Criar conjunto de dados, faça o seguinte:
- Para o código do conjunto de dados, insira
bigtable_bigquery_quickstart
. - Mantenha as configurações padrão restantes e clique em Criar conjunto de dados.
- Para o código do conjunto de dados, insira
Criar uma tabela com um fluxo de alterações ativado
No Console do Google Cloud, acesse a página Instâncias do Bigtable.
Clique no código da instância que você está usando para este guia de início rápido.
Se você não tiver uma instância disponível, crie uma com as configurações padrão em uma região perto de você.
No painel de navegação à esquerda, clique em Tabelas.
Clique em Criar uma tabela.
Nomeie a tabela como
bigquery-changestream-quickstart
.Adicione um grupo de colunas chamado
cf
.Selecione Ativar fluxo de alterações.
Clique em Criar.
Na página Tabelas do Bigtable, encontre sua tabela
bigquery-changestream-quickstart
.Na coluna Fluxo de alterações, clique em Conectar.
Na caixa de diálogo, selecione BigQuery.
Clique em Criar job do Dataflow.
Nos campos de parâmetro fornecidos, insira os valores de parâmetro. Não é necessário fornecer parâmetros opcionais.
- Defina o ID do perfil do aplicativo Bigtable como
default
. - Defina o conjunto de dados do BigQuery como
bigtable_bigquery_quickstart
.
- Defina o ID do perfil do aplicativo Bigtable como
Cliquem em Executar job.
Aguarde o status do job ser Iniciando ou Em execução antes de continuar. Leva cerca de cinco minutos assim que job é colocado na fila.
Mantenha o job aberto em uma guia para poder interrompê-lo ao limpar os recursos.
Gravar alguns dados no Bigtable
No Cloud Shell, escreva algumas linhas no Bigtable para que o registro de alterações possa gravar alguns dados no BigQuery. Se você gravar os dados após a criação do job, as alterações aparecerão. Não é necessário esperar que o status do job seja
running
.cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghi
Substitua:
- PROJECT_ID: o ID do projeto que você está usando.
- BIGTABLE_INSTANCE_ID: o ID da instância que contém a tabela
bigquery-changestream-quickstart
.
Ver os registros de alterações no BigQuery
No Console do Google Cloud, acesse a página BigQuery.
No painel Explorer, expanda seu projeto e o conjunto de dados
bigtable_bigquery_quickstart
.Clique na tabela
bigquery-changestream-quickstart_changelog
.Para acessar o registro de alterações, clique em Visualização.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Desative o fluxo de alterações na tabela:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Excluir a tabela
bigquery-changestream-quickstart
:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstart
Pare o pipeline de stream de alteração:
No console do Google Cloud, acesse a página Jobs do Dataflow.
Selecione o job de streaming na lista de jobs.
Na navegação, clique em Parar.
Na caixa de diálogo Interromper job, selecione Cancelar e clique em Interromper job.
Exclua o conjunto de dados do BigQuery:
No console do Google Cloud, acesse a página do BigQuery.
No painel Explorer, encontre o conjunto de dados
bigtable_bigquery_quickstart
e clique nele.Clique em Excluir, digite
delete
e clique em Excluir para confirmar.
Opcional: exclua a instância se você criou uma nova para este guia de início rápido:
cbt deleteinstance BIGTABLE_INSTANCE_ID