Este documento mostra como criar uma configuração de versão no Dataform para definir modelos de configurações de compilação que podem ser executados em uma programação. É possível usar configurações de versão para definir ambientes de execução, como preparo e produção.
Sobre as configurações de versão do Dataform
Para executar fluxos de trabalho SQL no BigQuery, o Dataform compila o código do fluxo de trabalho SQL em um resultado de compilação. Esse processo acontece automaticamente quando você desenvolve um fluxo de trabalho SQL em um espaço de trabalho do Dataform.
As configurações de versão permitem personalizar os resultados da compilação. É possível usá-los para criar ambientes de execução, como o preparo.
Configurações de versão
Em uma configuração de versão, você pode definir substituições de compilação das configurações de
workflow_settings.yaml
, definir variáveis de compilação e a frequência
de criação dos resultados de compilação.
Uma configuração de versão do Dataform contém as configurações de compilação abaixo:
- Configurações da versão
- ID da versão, commitish do git para resultados da compilação e frequência de criação desses resultados. A frequência é uma configuração opcional. Se definida, a frequência mínima será de uma hora.
- Substituições de compilação
- Substituições do projeto do Google Cloud,
prefixo da tabela, sufixo do esquema e variáveis de compilação
definidas em
workflow_settings.yaml
.
Como funciona uma configuração de versão
O Dataform cria resultados de compilação a partir de uma configuração de lançamento na
frequência especificada ou quando você aciona a compilação.
A frequência é uma configuração opcional e não é necessária para
criar uma configuração de versão. Se definida, a frequência mínima será de uma hora.
É possível
acionar a compilação manualmente na página Detalhes da configuração da versão
ou acionar a compilação com a API Dataform releaseConfigs
.
Durante a compilação, o Dataform extrai o código do commitish Git especificado do seu repositório. Em seguida, o Dataform compila o código com as substituições de compilação aplicadas (se houver) e cria o resultado da compilação. O resultado mais recente da compilação criado para a configuração da versão é o resultado da compilação em tempo real.
É possível programar execuções de resultados de compilação das configurações de versão em configurações do fluxo de trabalho. Também é possível executar uma configuração de versão selecionada fora de qualquer programação. Durante uma configuração de fluxo de trabalho, o Dataform executa o resultado da compilação em tempo real da configuração de lançamento selecionada.
Antes de começar
No Console do Google Cloud, acesse a página Dataform.
Selecione ou crie um repositório.
Opcional: para substituir o projeto padrão do Google Cloud na configuração de lançamento, conceda à sua conta de serviço do Dataform acesso ao projeto do Google Cloud que você planeja usar.
Funções exigidas
Para receber as permissões necessárias para criar uma configuração de versão,
peça ao administrador que conceda a você o papel do IAM de
Editor do Dataform (roles/dataform.editor
) nos repositórios.
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Criar uma configuração de versão
Para criar uma configuração de versão do Dataform, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na seção Configurações de versão, clique em Criar.
No painel Criar configuração da versão, defina as configurações da versão.
No campo ID da versão, digite um ID exclusivo para a configuração da versão.
Os IDs podem conter apenas números, letras, hifens e sublinhados.
No campo Git commitish, insira a ramificação do Git ou o SHA de confirmação do Git da versão.
Em um repositório do Dataform não conectado a um repositório remoto, o valor será sempre
main
.Opcional: no menu suspenso Frequência, selecione a frequência de criação de resultados de compilação.
Se definida, a frequência mínima será de uma hora.
Opcional: na seção Substituições de compilação, defina as configurações de compilação.
- No campo ID do projeto do Google Cloud, insira o ID do projeto do Google Cloud em que você quer armazenar o resultado da compilação.
- No campo Sufixo do esquema, insira um sufixo para anexar ao
esquema configurado em
workflow_settings.yaml
. - No campo Prefixo da tabela, insira um prefixo para todos os nomes de tabelas.
Opcional: na seção Variáveis de compilação, defina as variáveis de compilação.
- Clique em Adicionar variável.
- No campo Chave, insira a variável de compilação.
- No campo Valor, insira o valor da variável de compilação.
- Para adicionar outra variável de compilação, clique em Adicionar variável.
Clique em Criar.
Se você substituir o projeto padrão do Google Cloud, verifique se sua conta de serviço do Dataform tem acesso ao projeto do Google Cloud definido na configuração da versão.
Por exemplo, a configuração de versão abaixo cria um resultado de compilação production
da ramificação main
a cada hora,
sem nenhuma substituição de compilação:
- ID da versão:
production
- Commitish do Git:
main
- Frequência: por hora
- sem substituições de compilação
Mais detalhes de uma configuração de versão
É possível consultar os seguintes detalhes de uma configuração de versão:
- Configurações da versão
- Commitish do Git
- Carimbo de data/hora do resultado da última compilação
- Cronograma do cron
- Substituições de compilação
- Variáveis de compilação
- Resultado da compilação em tempo real
- Carimbo de data/hora da criação
- Commitish do Git
- SHA de confirmação
- Resultados da compilação programada anterior
Para consultar os detalhes de uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Selecione uma configuração de versão.
- Na página Detalhes da configuração da versão, inspecione os detalhes da configuração da versão.
A tabela Resultados da compilação programada exibe os resultados de compilação anteriores criados automaticamente pela configuração da versão. Os resultados de compilação criados manualmente ou por chamadas para a API Dataform não são exibidos na tabela.
Acionar a compilação manualmente
Para criar manualmente um resultado de compilação com base em uma configuração de versão selecionada, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Selecione uma configuração de versão.
- Na página Detalhes da configuração da versão, clique em Nova compilação.
O resultado da compilação recém-criado se torna o resultado ativo para essa configuração de lançamento.
Os resultados da compilação manual não são exibidos na tabela Resultados da compilação programada na página Detalhes da configuração de versão.
Acionar a execução de uma configuração de versão
Para acionar a execução do resultado da compilação em tempo real em uma configuração de versão selecionada para o BigQuery, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na seção Configurações de versão, clique em Iniciar execução.
- No painel Executar fluxo de trabalho manual, na lista suspensa Configuração da versão, selecione uma configuração de versão.
- Selecione as ações do fluxo de trabalho SQL a serem executadas:
- Para executar todo o fluxo de trabalho SQL, clique em Todas as ações.
- Para executar as ações selecionadas no fluxo de trabalho SQL, clique em Seleção de ações e selecione-as.
- Para executar ações com as tags selecionadas, clique em Seleção de tags e selecione as tags.
- Opcional: para executar as ações ou tags selecionadas e as dependências delas, selecione a opção Incluir dependências.
- Opcional: para executar as ações ou tags selecionadas e os dependentes, selecione a opção Incluir dependentes.
Opcional: para recriar todas as tabelas do zero, selecione a opção Executar com atualização completa.
Sem essa opção, o Dataform atualiza tabelas incrementais sem recriá-las do zero.
Clique em Iniciar execução.
Editar uma configuração de versão
Para editar uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- Na configuração da versão que você quer editar, clique no menu Mais e, em seguida, clique em Editar.
- No painel Editar configuração da versão, edite as configurações da versão e clique em Salvar.
Excluir uma configuração de versão
Para excluir uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Versões e programação.
- De acordo com a configuração da versão que você quer excluir, clique no menu Mais e, em seguida, clique em Excluir.
- Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
A seguir
- Para saber como criar configurações de fluxo de trabalho do Dataform, consulte Programar execuções com configurações de fluxo de trabalho.
- Para saber mais sobre o Dataform do ciclo de vida do código, consulte Introdução ao ciclo de vida do código no Dataform.