Este documento mostra como criar uma configuração de versão no Dataform para definir modelos de configurações de compilação, que podem ser executados em uma programação. É possível usar configurações de versão para configurar ambientes de execução, por exemplo, preparo e produção.
Sobre as configurações de versão do Dataform
Para executar fluxos de trabalho SQL no BigQuery, o Dataform compila o código de fluxo de trabalho SQL em um resultado de compilação. Esse processo acontece automaticamente quando você desenvolve um fluxo de trabalho SQL em um espaço de trabalho do Dataform.
As configurações de versão permitem personalizar os resultados da compilação. É possível usá-las para criar ambientes de execução, por exemplo, o preparo.
Configurações da versão
Em uma configuração de versão, você pode definir substituições de compilação de
configurações dataform.json
, definir variáveis de compilação e definir a frequência
de criação dos resultados da compilação.
Uma configuração de versão do Dataform contém as seguintes configurações de compilação:
- Configurações da versão
- ID da versão, confirmação git para resultados de compilação e frequência de criação de resultados da compilação.
- Substituições de compilação
- Substituições do projeto do Google Cloud, do prefixo da tabela, do sufixo do esquema e das variáveis de compilação definidas em
dataform.json
.
Como funciona uma configuração de versão
O Dataform cria resultados de compilação a partir de uma configuração de lançamento na
frequência especificada ou quando você aciona a compilação.
A frequência é uma configuração opcional e não é necessária para criar uma configuração de versão.
É possível
acionar manualmente a compilação na página Detalhes da configuração de lançamento
ou com a API Dataform releaseConfigs
.
Durante a compilação, o Dataform extrai o código do commit do Git especificado no repositório. Em seguida, o Dataform compila o código com as modificações de compilação aplicadas (se houver) e cria o resultado. O resultado da compilação mais recente criado para a configuração da versão é o resultado da compilação em tempo real.
É possível programar execuções de resultados de compilação a partir das configurações de lançamento em configurações de fluxo de trabalho. Também é possível executar uma configuração de versão selecionada fora da programação. Durante uma execução de configuração de fluxo de trabalho, o Dataform executa o resultado da compilação em tempo real a partir da configuração de versão selecionada.
Antes de começar
No Console do Google Cloud, acesse a página do Dataform.
Selecione ou crie um repositório.
Opcional: para substituir o projeto padrão do Google Cloud na configuração da versão, conceda à sua conta de serviço do Dataform acesso ao projeto do Google Cloud que você planeja usar.
Funções exigidas
Para receber as permissões necessárias para criar uma configuração de versão,
peça ao administrador para conceder a você o papel de
Editor do Dataform (roles/dataform.editor
) nos repositórios.
Para obter mais informações sobre como conceder papéis, consulte
Gerenciar o acesso.
Também é possível conseguir as permissões necessárias com papéis personalizados ou outros papéis predefinidos.
Criar uma configuração de versão
Para criar uma configuração de versão do Dataform, siga estas etapas:
- No seu repositório, acesse Configurações da versão e clique em Nova configuração de versão.
No painel Criar uma configuração de versão, defina as configurações de versão.
No campo Código da versão, insira um ID exclusivo para a configuração da versão.
Os códigos só podem incluir números, letras, hifens e sublinhados.
No campo Git commitish, insira o branch ou SHA do commit do Git para a versão.
Em um repositório do Dataform não conectado a um repositório remoto, o valor é sempre
main
.- Opcional: no menu suspenso Frequência, selecione a frequência de criação de resultados da compilação.
Opcional: na seção Compilações de compilação, defina as configurações de compilação.
- No campo ID do projeto do Google Cloud, insira o ID do projeto do Google Cloud em que você quer armazenar o resultado da compilação.
- No campo Sufixo do esquema, insira um sufixo para anexar ao esquema configurado em
dataform.json
. - No campo Prefixo da tabela, insira um prefixo para todos os nomes de tabela.
Opcional: na seção Variáveis de compilação, defina variáveis de compilação.
- Clique em Adicionar variável.
- No campo Chave, insira a variável de compilação.
- No campo Value, insira o valor da variável de compilação.
- Para adicionar outra variável de compilação, clique em Adicionar variável.
Clique em Criar.
Se você modificar o projeto padrão do Google Cloud, verifique se a conta de serviço do Dataform tem acesso ao projeto do Google Cloud definido na configuração da versão.
Por exemplo, a configuração da versão a seguir cria um resultado de compilação production
a partir da ramificação main
a cada hora,
sem nenhuma modificação de compilação:
- ID da versão:
production
- Compromisso do Git:
main
- Frequência: por hora
- nenhuma modificação de compilação
Ver detalhes de uma configuração de versão
É possível ver os seguintes detalhes de uma configuração de versão:
- Configurações da versão
- Commitish do Git
- Timestamp da última compilação
- Cronograma do cron
- Substituições de compilação
- Variáveis de compilação
- Resultado da compilação em tempo real
- Carimbo de data/hora da criação
- Commitish do Git
- Confirmar SHA
- Resultados de compilação anteriores
Para ver detalhes de uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Configurações da versão.
- Selecione uma configuração de versão.
- Na página Detalhes da configuração da versão, inspecione os detalhes da configuração.
Acionar manualmente a compilação
Para criar manualmente um resultado de compilação com base em uma configuração de versão selecionada, siga estas etapas:
- No seu repositório, acesse Configurações da versão.
- Selecione uma configuração de versão.
- Na página Detalhes da configuração de lançamento, clique em Nova compilação.
O resultado da compilação recém-criado se torna o resultado ativo para essa configuração de versão.
Acionar a execução de uma configuração de versão
Para acionar a execução do resultado da compilação em tempo real em uma configuração de versão selecionada para o BigQuery, siga estas etapas:
- No seu repositório, acesse Configurações da versão e clique em Iniciar execução.
- No painel Executar fluxo de trabalho manual, na lista suspensa Configuração da versão, selecione uma configuração de versão.
- Selecione as ações do fluxo de trabalho SQL que serão executadas:
- Para executar todo o fluxo de trabalho do SQL, clique em Todas as ações.
- Para executar as ações selecionadas no fluxo de trabalho SQL, clique em Seleção de ações e selecione as ações.
- Para executar ações com tags selecionadas, clique em Seleção de tags e selecione as tags.
- Opcional: para executar ações ou tags selecionadas e as dependências delas, selecione a opção Incluir dependências.
- Opcional: para executar ações ou tags selecionadas e os dependentes, selecione a opção Incluir dependentes.
Opcional: para recriar todas as tabelas do zero, selecione a opção Executar com atualização completa.
Sem essa opção, o Dataform atualiza tabelas incrementais sem recriá-las do zero.
Clique em Iniciar execução.
Editar uma configuração de versão
Para editar uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Configurações da versão.
- Ao lado da configuração de versão que você quer editar, clique no menu
Mais e, em seguida, clique em Editar.
- No painel Editar versão da configuração, edite as configurações da versão e clique em Salvar.
Excluir uma configuração de versão
Para excluir uma configuração de versão, siga estas etapas:
- No seu repositório, acesse Configurações da versão.
- Na configuração da versão que você quer excluir, clique no menu
Mais e em Excluir.
- No pop-up Excluir configuração da versão, clique em Excluir.
A seguir
- Para saber como criar configurações de fluxo de trabalho do Dataform, consulte Programar execuções com configurações de fluxo de trabalho.
- Para saber mais sobre o ciclo de vida do código no Dataform, consulte Introdução ao ciclo de vida do código no Dataform.