Neste documento, mostramos como criar uma configuração de fluxo de trabalho no Dataform para programar e configurar execuções de fluxo de trabalho SQL. É possível usar as configurações de fluxo de trabalho para executar fluxos de trabalho SQL do Dataform de acordo com uma programação.
Sobre as configurações do fluxo de trabalho
Para programar execuções do Dataform de todas ou algumas ações de fluxo de trabalho SQL no BigQuery, crie configurações de fluxo de trabalho. Em uma configuração de fluxo de trabalho, você seleciona uma configuração de versão de compilação, seleciona as ações do fluxo de trabalho SQL para execução e define a programação.
Em seguida, durante uma execução programada da configuração do fluxo de trabalho, o Dataform implanta sua seleção de ações da compilação mais recente, resultando na configuração de versão no BigQuery. Também é possível acionar manualmente a execução de uma configuração de fluxo de trabalho com o WorkflowConfigs da API Dataform.
Uma configuração de fluxo de trabalho do Dataform contém as seguintes configurações de execução:
- ID da configuração do fluxo de trabalho
- Configuração da versão
Conta de serviço
Conta de serviço associada à configuração do fluxo de trabalho. É possível selecionar a conta de serviço padrão do Dataform, uma conta de serviço associada ao projeto do Google Cloud ou inserir manualmente uma conta de serviço diferente. Por padrão, as configurações de fluxo de trabalho usam as mesmas contas de serviço que os repositórios delas.
Ações do fluxo de trabalho SQL a serem executadas:
- Todas as ações
- Seleção de ações
- Seleção de tags
Cronograma de execução e fuso horário
Antes de começar
No console do Google Cloud, acesse a página do Dataform.
Selecione ou crie um repositório.
Crie uma configuração de versão.
Funções exigidas
Para receber as permissões necessárias para criar uma configuração de fluxo de trabalho,
peça ao administrador para conceder a você o
papel do IAM de Editor do Dataform (roles/dataform.editor
) nos repositórios.
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Para usar uma conta de serviço diferente da conta de serviço padrão do Dataform, conceda acesso à conta de serviço personalizada.
Criar uma configuração de fluxo de trabalho
Para criar uma configuração de fluxo de trabalho do Dataform, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na seção Configurações do fluxo de trabalho, clique em Criar.
No painel Criar configuração do fluxo de trabalho, no campo ID de configuração, insira um ID exclusivo para a configuração do fluxo de trabalho.
Os IDs podem conter apenas números, letras, hifens e sublinhados.
No menu suspenso Configuração da versão, selecione uma Configuração de versão de compilação.
Opcional: no campo Frequência, insira a frequência de execuções no formato unix-cron.
Para garantir que o Dataform execute o resultado mais recente da compilação na configuração de lançamento correspondente, mantenha um intervalo mínimo de uma hora entre o momento da criação do resultado e o da execução programada.
Na lista suspensa Conta de serviço, selecione uma conta de serviço para a configuração do fluxo de trabalho.
No menu suspenso, selecione a conta de serviço padrão do Dataform ou qualquer conta de serviço associada ao projeto do Google Cloud a que você tem acesso. Se você não selecionar uma conta de serviço, a configuração do fluxo de trabalho usará a conta de serviço do repositório.
Opcional: no menu suspenso Fuso horário, selecione o fuso horário das execuções.
O fuso horário padrão é UTC.
Selecione as ações do fluxo de trabalho SQL a serem executadas:
- Para executar todo o fluxo de trabalho SQL, clique em Todas as ações.
- Para executar as ações selecionadas no fluxo de trabalho SQL, clique em Seleção de ações e selecione-as.
- Para executar ações com as tags selecionadas, clique em Seleção de tags e selecione as tags.
- Opcional: para executar as ações ou tags selecionadas e as dependências delas, selecione a opção Incluir dependências.
- Opcional: para executar as ações ou tags selecionadas e os dependentes, selecione a opção Incluir dependentes.
- Opcional: para recriar todas as tabelas do zero, selecione a opção Executar com atualização completa.
Sem essa opção, o Dataform atualiza tabelas incrementais sem recriá-las do zero.
Clique em Criar.
Por exemplo, a configuração de fluxo de trabalho a seguir executa ações com a tag hourly
a cada hora no fuso horário CEST:
- ID de configuração:
production-hourly
- Configuração da versão: -
- Frequência:
0 * * * *
- Fuso horário:
Central European Summer Time (CEST)
- Seleção de ações do fluxo de trabalho SQL: seleção de tags, tag
hourly
Editar uma configuração de fluxo de trabalho
Para editar uma configuração de fluxo de trabalho, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na configuração do fluxo de trabalho que você quer editar, clique no menu Mais e, em seguida, clique em Editar.
- No painel Editar configuração do fluxo de trabalho, edite as configurações da versão e clique em Salvar.
Excluir uma configuração de fluxo de trabalho
Para excluir uma configuração de fluxo de trabalho, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na configuração do fluxo de trabalho que você quer excluir, clique no menu Mais e, em seguida, clique em Excluir.
- Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
A seguir
- Para saber como definir as configurações da versão de compilação do Dataform, consulte Criar uma configuração de versão.
- Para saber mais sobre o Dataform do ciclo de vida do código, consulte Introdução ao ciclo de vida do código no Dataform.