Criar ambientes de desenvolvimento
Neste guia de início rápido, você verá as etapas para criar ambientes de desenvolvimento individuais no Dataform, de modo que cada desenvolvedor possa trabalhar no próprio ambiente de desenvolvimento:
- Crie um repositório do Dataform.
- Conceder ao Dataform acesso ao BigQuery.
Configurar substituições de compilação do espaço de trabalho.
Configure substituições de compilação que o Dataform aplicará a todos os espaços de trabalho no seu repositório, transformando espaços de trabalho em ambientes de desenvolvimento isolados.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
No momento, o Dataform não é compatível com o VPC Service Controls. Se você usar o VPC Service Controls, exclua os recursos do BigQuery do perímetro do VPC Service Controls para usar o Dataform.
Funções exigidas
Para receber as permissões necessárias para executar todas as tarefas neste tutorial, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Administrador do Dataform (
roles/dataform.admin
) em repositórios -
Dataform Editor (
roles/dataform.editor
) em espaços de trabalho e workflowInvocations
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou outros papéis predefinidos.
Criar um repositório do Dataform
No Console do Google Cloud, acesse a página do Dataform.
Clique em
Criar repositório.Na página Criar repositório, faça o seguinte:
No campo Código do repositório, insira
quickstart-dev
.Na lista Região, selecione
europe-west4
.Clique em Criar.
Clique em Concluído.
Conceder acesso ao Dataform ao BigQuery
Para executar fluxos de trabalho no BigQuery, a conta de serviço do Dataform precisa ter os seguintes papéis necessários:
- Editor de dados do BigQuery em projetos a que o Dataform precisa de acesso de leitura e gravação. Eles geralmente incluem o projeto que hospeda seu repositório do Dataform.
- Visualizador de dados do BigQuery em projetos a que o Dataform precisa de acesso somente leitura.
- BigQuery Job User no projeto que hospeda o repositório do Dataform.
Para conceder esses papéis, siga estas etapas:
No console do Google Cloud, abra a página IAM.
Clique em Adicionar.
No campo Novos principais, insira o ID da conta de serviço do Dataform.
Na lista suspensa Selecionar um papel, selecione o papel Usuário de job do BigQuery.
Clique em Adicionar outro papel e, na lista suspensa Selecionar um papel, selecione o papel Editor de dados do BigQuery.
Clique em Adicionar outro papel e, na lista suspensa Selecionar um papel, selecione o papel Visualizador de dados do BigQuery.
Clique em Save.
Configurar substituições de compilação do espaço de trabalho
Para criar ambientes de desenvolvimento isolados com modificações de compilação do espaço de trabalho do Dataform, siga estas etapas:
No Console do Google Cloud, acesse a página do Dataform.
Clique em
quickstart-dev
.Clique em Configurações e em Editar.
No painel Modificações de compilação do espaço de trabalho, no campo Sufixo do esquema, insira
${workspaceName}
.Quando você aciona a execução em um espaço de trabalho, o Dataform anexa o nome do espaço de trabalho como um sufixo ao esquema padrão definido em
dataform.json
. Neste guia de início rápido, usamos as configurações padrão do Dataform com o esquemadataform
.Clique em Save.
O Dataform aplica substituições de compilação de espaço de trabalho a todos os espaços de trabalho em seu repositório.
Com essa configuração, quando você executa manualmente um fluxo de trabalho SQL em um espaço de trabalho,
o Dataform o executa com modificações de compilação do espaço de trabalho.
Como resultado, o Dataform executa o fluxo de trabalho SQL no esquema dataform_workspaceName
no BigQuery, transformando o espaço de trabalho em um ambiente de desenvolvimento isolado.
Por exemplo, quando você aciona manualmente a execução em um espaço de trabalho sasha
, o Dataform executa seu fluxo de trabalho SQL no esquema dataform_sasha
no BigQuery.
Para executar fluxos de trabalho SQL sem modificações de compilação de espaço de trabalho, mas manter as modificações para compilações em ambientes de desenvolvimento, crie configurações de versão para configurar outros ambientes de execução, como staging
e production
.
Limpeza
Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Excluir conjuntos de dados criados no BigQuery
Para evitar cobranças por recursos do BigQuery, exclua conjuntos de dados com nomes que começam em dataform
, por exemplo, dataform-sasha
.
No Console do Google Cloud, acesse a página BigQuery.
No painel Explorer, expanda o projeto e selecione um conjunto de dados.
Clique no menu
Ações e selecione Excluir.
Na caixa de diálogo Excluir conjunto de dados, insira
delete
na caixa de texto e clique em Excluir.
Excluir o repositório do Dataform
Não há custos associados à criação de repositórios do Dataform. No entanto, se você quiser excluir um repositório e todo o conteúdo dele, siga estas etapas:
No Console do Google Cloud, acesse a página do Dataform.
Em
quickstart-dev
, clique no menu Maise selecione Excluir.
- Na janela Excluir repositório, insira o nome do repositório para confirmar a exclusão.
Para confirmar, clique em Excluir.
A seguir
Para saber mais sobre o ciclo de vida do código no Dataform, consulte Introdução ao ciclo de vida do código no Dataform.
Para saber mais sobre as práticas recomendadas para o ciclo de vida do código no Dataform, consulte Como gerenciar o ciclo de vida do código.
Para saber mais sobre substituições de compilação do espaço de trabalho no Dataform, consulte Criar modificações de compilação do espaço de trabalho.
Para saber como programar execuções de produção no Dataform, consulte Programar execuções de produção.