Criar ambientes de desenvolvimento
Neste guia de início rápido, mostramos as etapas para criar modelos de desenvolvimento ambientes no Dataform, para que cada desenvolvedor possa trabalhar por conta própria ambiente de desenvolvimento:
- Criar um Dataform repositório.
Conceda acesso ao Dataform para no BigQuery.
Configurar substituições de compilação que o Dataform vai aplicar a todas espaços de trabalho no seu repositório, transformando espaços de trabalho em espaços ambientes de desenvolvimento de software.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Funções exigidas
Para ter as permissões necessárias para executar todas as tarefas neste tutorial, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Administrador do Dataform (
roles/dataform.admin
): repositórios -
Editor do Dataform (
roles/dataform.editor
): espaços de trabalho e invocações de fluxo de trabalho
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias com papéis personalizados ou outros papéis predefinidos.
Criar um repositório do Dataform
No Console do Google Cloud, acesse a página Dataform.
Clique em
Criar repositório.Na página Criar repositório, faça o seguinte:
No campo Código do repositório, insira
quickstart-dev
.Na lista Região, selecione
europe-west4
.Clique em Criar.
Clique em Concluído.
Conceder acesso ao Dataform ao BigQuery
Para executar fluxos de trabalho no BigQuery, o Dataform a conta de serviço precisa ter os seguintes papéis obrigatórios:
- Editor de dados do BigQuery em projetos em que o Dataform precisa de acesso de leitura e gravação. Eles geralmente incluem o projeto que hospeda o repositório do Dataform.
- Leitor de dados do BigQuery em projetos a que o Dataform precisa de acesso somente leitura.
- Usuário de jobs do BigQuery no projeto que hospeda o repositório do Dataform.
Para conceder esses papéis, siga estas etapas:
No console do Google Cloud, abra a página IAM.
Clique em Adicionar.
No campo Novos principais, insira seu serviço do Dataform ID da conta de serviço.
Na lista suspensa Selecionar papel, selecione o papel Usuário de jobs do BigQuery.
Clique em Adicionar outro papel e, em seguida, no menu suspenso Selecionar um papel selecione o papel Editor de dados do BigQuery.
Clique em Adicionar outro papel e, em seguida, no menu suspenso Selecionar um papel selecione o papel Leitor de dados do BigQuery.
Clique em Salvar.
Configurar substituições de compilação do espaço de trabalho
Criar ambientes de desenvolvimento isolados com o espaço de trabalho do Dataform substituições de compilação, siga estas etapas:
No Console do Google Cloud, acesse a página Dataform.
Clique em
quickstart-dev
.Clique em Configurações e em Editar.
No painel Substituições de compilação do espaço de trabalho, no campo Sufixo do esquema, insira
${workspaceName}
.Quando você aciona a execução em um espaço de trabalho, o Dataform anexa o do espaço de trabalho como um sufixo do esquema padrão definido em configurações do fluxo de trabalho. Neste guia de início rápido, usamos as configurações padrão do Dataform com o esquema padrão
dataform
.Clique em Salvar.
O Dataform aplica substituições de compilação do espaço de trabalho a todos os espaços de trabalho seu repositório.
Com essa configuração, quando você executa manualmente um fluxo de trabalho SQL em uma
espaço de trabalho, o Dataform o executa com substituições de compilação do espaço de trabalho.
Como resultado, o Dataform executa o fluxo de trabalho SQL no esquema dataform_workspaceName
no BigQuery, transformando o
em um ambiente de desenvolvimento isolado.
Por exemplo, quando você aciona manualmente a execução em um espaço de trabalho sasha
,
O Dataform executa seu fluxo de trabalho SQL no esquema dataform_sasha
em
no BigQuery.
Para executar fluxos de trabalho SQL sem substituições de compilação do espaço de trabalho, mas manter
substituições de compilação do workspace para ambientes de desenvolvimento, é possível criar
configurações de lançamento para definir outros ambientes de execução, por exemplo,
staging
e production
.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Excluir conjuntos de dados criados no BigQuery
Exclua conjuntos de dados para evitar cobranças de recursos do BigQuery
com nomes que começam em dataform
, por exemplo, dataform-sasha
.
No Console do Google Cloud, acesse a página BigQuery.
No painel Explorer, expanda o projeto e selecione um conjunto de dados.
Clique no menu
Ações e selecione Excluir.Na caixa de diálogo Excluir conjunto de dados, insira
delete
no campo e depois Clique em Excluir.
Excluir o repositório do Dataform
Não há custos associados à criação de repositórios do Dataform. No entanto, se você quiser excluir um repositório e todo o conteúdo dele, siga estas etapas:
No Console do Google Cloud, acesse a página Dataform.
Até
quickstart-dev
, clique no menu Mais do e e selecione Excluir.- Na janela Excluir repositório, insira o nome do repositório para confirmar a exclusão.
Para confirmar, clique em Excluir.
A seguir
Para saber mais sobre o ciclo de vida do código no Dataform, consulte Introdução para programar o ciclo de vida no Dataform.
Para saber mais sobre as práticas recomendadas para o ciclo de vida do código no Dataform, consulte Como gerenciar o ciclo de vida do código.
Para saber mais sobre as substituições de compilação do espaço de trabalho no Dataform, consulte Criar compilação do espaço de trabalho substituições.
Para saber como programar execuções de produção no Dataform, consulte Programar produção a mais de 10 execuções.