Programar execuções de produção
Neste guia de início rápido, mostramos as etapas a seguir para programar execuções de produção no Dataform:
- Crie um repositório do Dataform.
- Conceda ao Dataform acesso ao BigQuery.
Crie uma configuração de versão para definir o ambiente de produção.
Crie uma configuração de versão
production
com a frequência de criação de resultados de compilaçãoproduction
.Criar uma configuração de fluxo de trabalho para programar execuções no ambiente de produção.
Crie uma configuração de fluxo de trabalho
production
, selecione a configuração de versãoproduction
e defina uma programação para executar os resultados da compilaçãoproduction
.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
Funções exigidas
Para receber as permissões necessárias para executar todas as tarefas neste tutorial, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Administrador do Dataform (
roles/dataform.admin
) em repositórios -
Editor do Dataform (
roles/dataform.editor
) em espaços de trabalho e invocações de fluxo de trabalho
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Criar um repositório do Dataform
No console do Google Cloud, acesse a página do Dataform.
Clique em
Criar repositório.Na página Criar repositório, faça o seguinte:
No campo Código do repositório, insira
quickstart-production
.Na lista Região, selecione
europe-west4
.Clique em Criar.
Clique em Concluído.
Conceder acesso ao Dataform ao BigQuery
Para executar fluxos de trabalho no BigQuery, a conta de serviço do Dataform precisa ter os seguintes papéis necessários:
- Editor de dados do BigQuery em projetos em que o Dataform precisa de acesso de leitura e gravação. Eles geralmente incluem o projeto que hospeda o repositório do Dataform.
- Leitor de dados do BigQuery em projetos em que o Dataform precisa de acesso somente leitura.
- Usuário de jobs do BigQuery no projeto que hospeda o repositório do Dataform.
Para conceder esses papéis, siga estas etapas:
No console do Google Cloud, abra a página IAM.
Clique em Adicionar.
No campo Novos principais, insira o ID da conta de serviço do Dataform.
Na lista suspensa Selecionar um papel, escolha o papel Usuário de jobs do BigQuery.
Clique em Adicionar outro papel e, na lista suspensa Selecionar um papel, selecione o papel Editor de dados do BigQuery.
Clique em Adicionar outro papel e, na lista suspensa Selecionar um papel, selecione o papel Leitor de dados do BigQuery.
Clique em Save.
Criar uma configuração de versão
Para criar resultados de compilação de produção do repositório quickstart-production
, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações de versão e em Nova configuração de versão.
No painel Criar configuração de versão, defina as seguintes configurações:
No campo ID da versão, digite
production
.No campo Git commitish, deixe o valor padrão
main
.No menu suspenso Frequência, selecione Personalizado.
No campo Programação personalizada, insira
0 16 * * *
.No menu suspenso Fuso horário, selecione um fuso horário UTC+1, por exemplo, Horário de Greenwich (GMT).
Todos os dias, às 16h UTC+1, o Dataform vai compilar o repositório
quickstart-production
e aplicar as configurações de compilação definidas nesta configuração de versão para criar resultados de compilaçãoproduction
.Clique em Criar.
A configuração de versão production
cria um resultado de compilação de todo o
repositório quickstart-production
todos os dias às 16h UTC+1.
Criar uma configuração de fluxo de trabalho
Para programar a execução de tabelas production
, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações de fluxo de trabalho e, em seguida, clique em Nova configuração de fluxo de trabalho.
No painel Criar configuração do fluxo de trabalho, no campo ID de configuração, insira
production
.No menu suspenso Configuração da versão, selecione
production
.No campo Frequência, use
0 17 * * *
.No menu suspenso Fuso horário, selecione um fuso horário UTC+1, por exemplo, Horário de Greenwich (GMT).
Todos os dias, às 17h UTC+1, o Dataform executará o resultado mais recente da compilação
production
do repositórioquickstart-production
.Para garantir que o Dataform execute o resultado mais recente da compilação na configuração de lançamento correspondente, mantenha um intervalo mínimo de uma hora entre o momento da criação do resultado e o da execução programada.
Clique em Todas as ações.
O Dataform vai executar todas as ações do fluxo de trabalho SQL no resultado da compilação
production
.Clique em Criar.
A configuração do fluxo de trabalho production
executa todo o resultado
de compilação mais recente criado pela configuração de versão production
todos os dias às 16h UTC+1.
Mostrar resultados anteriores da compilação de production
Para conferir os resultados da compilação de production
programada anteriormente, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações da versão.
Clique em
production
.
Mostrar production
execuções anteriores de fluxo de trabalho
Para ver as production
execuções anteriores de fluxo de trabalho, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações do fluxo de trabalho.
Limpar
Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Excluir o conjunto de dados criado no BigQuery
Para evitar cobranças por recursos do BigQuery, siga estas etapas para excluir o conjunto de dados chamado dataform_production
:
No Console do Google Cloud, acesse a página BigQuery.
No painel Explorer, expanda o projeto e selecione
dataform_production
.Clique no menu
Ações e selecione Excluir.Na caixa de diálogo Excluir conjunto de dados, digite excluir e depois clique em Excluir.
Excluir a configuração da versão do Dataform
Não há custos associados à criação de configurações de versão do
Dataform. No entanto, se você quiser excluir a configuração da versão
production
, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações da versão.
Na configuração da versão
production
, clique no menu Mais e, em seguida, clique em Excluir.Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
Excluir a configuração do fluxo de trabalho do Dataform
Para evitar cobranças pelos recursos do BigQuery, siga estas etapas para excluir a configuração do fluxo de trabalho production
do Dataform:
No console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-production
.Clique em Configurações do fluxo de trabalho.
Na configuração do fluxo de trabalho
production
, clique no menu Mais e, em seguida, clique em Excluir.Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
Excluir o repositório do Dataform
Não há custos associados à criação de repositórios do Dataform. No entanto, se você quiser excluir um repositório e todo o conteúdo dele, siga estas etapas:
No console do Google Cloud, acesse a página do Dataform.
Ao
quickstart-production
, clique no menu Mais e selecione Excluir.Na janela Excluir repositório, insira o nome do repositório para confirmar a exclusão.
Para confirmar, clique em Excluir.
A seguir
Para saber mais sobre o ciclo de vida do código no Dataform, consulte Introdução ao ciclo de vida do código no Dataform.
Para saber mais sobre as práticas recomendadas para o ciclo de vida do código no Dataform, consulte Como gerenciar o ciclo de vida do código.
Para saber mais sobre configurações de versão no Dataform, consulte Criar uma configuração de versão.
Para saber mais sobre as configurações do fluxo de trabalho no Dataform, consulte Programar execuções com configurações do fluxo de trabalho.