Agende execuções de produção
Este guia de início rápido explica os seguintes passos para agendar execuções de produção no Dataform:
- Crie um repositório do Dataform.
- Conceda acesso do Dataform ao BigQuery.
Crie uma configuração de lançamento para configurar o ambiente de produção.
Crie uma configuração de lançamento para definir a frequência de criação de resultados de compilação.
production
production
Crie uma configuração do fluxo de trabalho para agendar execuções no ambiente de produção.
Crie uma configuração do fluxo de trabalho, selecione a configuração de lançamento e defina uma programação para executar os resultados da compilação.
production
production
production
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
Administrador do Dataform (
roles/dataform.admin
) em repositórios -
Editor do Dataform (
roles/dataform.editor
) em espaços de trabalho e workflowInvocations Na Google Cloud consola, aceda à página Dataform.
Clique em
Criar repositório.Na página Criar repositório, faça o seguinte:
No campo ID do repositório, introduza
quickstart-production
.Na lista Região, selecione
europe-west4
.Clique em Criar.
Clique em Concluído.
- Editor de dados do BigQuery em projetos aos quais o Dataform precisa de acesso de leitura e escrita. Normalmente, incluem o projeto que aloja o seu repositório do Dataform.
- Visualizador de dados do BigQuery em projetos aos quais o Dataform precisa de acesso só de leitura.
- Utilizador da tarefa do BigQuery no projeto que aloja o seu repositório do Dataform.
Na Google Cloud consola, aceda à página IAM.
Clique em Adicionar.
No campo Novos membros, introduza o ID da conta de serviço do Dataform.
Na lista Selecionar uma função, selecione a função Utilizador de tarefas do BigQuery.
Clique em Adicionar outra função e, de seguida, na lista Selecionar uma função, selecione a função Editor de dados do BigQuery.
Clique em Adicionar outra função e, de seguida, na lista Selecionar uma função, selecione a função Visualizador de dados do BigQuery.
Clique em Guardar.
Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Configurações de lançamentos e, de seguida, em Nova configuração de lançamento.
No painel Criar configuração de lançamento, configure as seguintes definições:
No campo ID da versão, introduza
production
.No campo Git commitish, mantenha o valor predefinido
main
.No menu Frequência, selecione Personalizado.
No campo Horário personalizado, introduza
0 16 * * *
.No menu Fuso horário, selecione um fuso horário UTC+1, por exemplo, Hora do Meridiano de Greenwich (GMT).
Todos os dias às 16:00 UTC+1, o Dataform compila o repositório e aplica as definições de compilação configuradas nesta configuração de versão para criar resultados de compilação.
quickstart-production
production
Clique em Criar.
Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Configurações de fluxo de trabalho e, de seguida, clique em Nova configuração de fluxo de trabalho.
No painel Criar configuração do fluxo de trabalho, no campo ID da configuração, introduza
production
.No menu Configuração de lançamento, selecione
production
.No campo Frequência, introduza
0 17 * * *
.No menu Fuso horário, selecione um fuso horário UTC+1, por exemplo, Hora do Meridiano de Greenwich (GMT).
Todos os dias às 17:00 UTC+1, o Dataform executa o
production
resultado da compilação mais recente do repositórioquickstart-production
.Para garantir que o Dataform executa o resultado da compilação mais recente na configuração de lançamento correspondente, mantenha um intervalo mínimo de 1 hora entre a hora de criação do resultado da compilação e a hora de execução agendada.
Clique em Todas as ações.
O Dataform executa todas as ações do fluxo de trabalho no resultado da compilação
production
.Clique em Criar.
Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Publicar configurações.
Clique em
production
.Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Configurações do fluxo de trabalho.
Na Google Cloud consola, aceda à página BigQuery.
No painel Explorador, expanda o projeto e selecione
dataform_production
.Clique no menu
Ações e, de seguida, selecione Eliminar.Na caixa de diálogo Eliminar conjunto de dados, introduza eliminar e, de seguida, clique em Eliminar.
Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Publicar configurações.
Junto à configuração de lançamento
production
, clique no menu Mais e, de seguida, em Eliminar.Na caixa de diálogo Eliminar configuração de lançamento, clique em Eliminar.
Na Google Cloud consola, aceda à página Dataform.
Clique em
quickstart-production
.Clique em Configurações do fluxo de trabalho.
Na configuração do fluxo de trabalho
production
, clique no menu Mais e, de seguida, em Eliminar.Na caixa de diálogo Eliminar configuração de lançamento, clique em Eliminar.
Na Google Cloud consola, aceda à página Dataform.
Em
quickstart-production
, clique no menu Mais e, de seguida, selecione Eliminar.Na janela Eliminar repositório, introduza o nome do repositório para confirmar a eliminação.
Para confirmar, clique em Eliminar.
Para saber mais sobre o ciclo de vida do código no Dataform, consulte o artigo Introdução ao ciclo de vida do código no Dataform.
Para saber mais sobre as práticas recomendadas para o ciclo de vida do fluxo de trabalho no Dataform, consulte o artigo Práticas recomendadas para o ciclo de vida do fluxo de trabalho.
Para saber mais sobre as configurações de lançamento no Dataform, consulte o artigo Crie uma configuração de lançamento.
Para saber mais sobre as configurações de fluxo de trabalho no Dataform, consulte o artigo Agende execuções com configurações de fluxo de trabalho.
Funções necessárias
Para receber as autorizações de que precisa para realizar todas as tarefas neste tutorial, peça ao seu administrador para lhe conceder as seguintes funções da IAM:
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Crie um repositório do Dataform
Conceda acesso do Dataform ao BigQuery
Para executar fluxos de trabalho no BigQuery, a conta de serviço do Dataform tem de ter as seguintes funções necessárias:
Para conceder estas funções, siga estes passos:
Crie uma configuração de lançamento
Para criar resultados de compilação de produção do repositório quickstart-production
, siga estes passos:
A configuração de lançamento production
cria um resultado de compilação de todo o repositório quickstart-production
todos os dias às 16:00 UTC+1.
Crie uma configuração do fluxo de trabalho
Para agendar a execução de tabelas production
, siga estes passos:
A configuração do fluxo de trabalho production
executa o resultado da compilação mais recente criado pela configuração de lançamento production
todos os dias às 16:00 UTC+1.
Veja os resultados de compilação anteriores de production
Para ver os resultados de compilação production
agendados anteriores, siga estes passos:
Veja as execuções de fluxos de trabalho production
anteriores
Para ver execuções de fluxo de trabalho production
anteriores, siga estes passos:
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
Elimine o conjunto de dados criado no BigQuery
Para evitar incorrer em custos por recursos do BigQuery, siga estes passos para eliminar o conjunto de dados denominado dataform_production
:
Elimine a configuração de lançamento do Dataform
Não existem custos associados à criação de configurações de lançamento do Dataform. No entanto, se quiser eliminar a configuração de lançamento, siga estes passos:production
Elimine a configuração do fluxo de trabalho do Dataform
Para evitar incorrer em custos por recursos do BigQuery, siga estes passos para eliminar a configuração do fluxo de trabalho do Dataform production
:
Elimine o repositório do Dataform
Não existem custos associados à criação de repositórios do Dataform. No entanto, se quiser eliminar um repositório e todo o respetivo conteúdo, siga estes passos: