Neste documento, mostramos como criar um repositório, definir e editar a conta de serviço do repositório e excluir um repositório no Dataform.
Ao criar um repositório do Dataform, é necessário definir as seguintes configurações:
- ID do repositório
- Um ID exclusivo do repositório. Os IDs podem incluir apenas números, letras, hífens e sublinhados.
- Região
Região do Dataform para armazenar o repositório e o conteúdo dele.
Essa região de armazenamento pode ser diferente da região de processamento em que o Dataform processa seu código e armazena a saída das execuções. Por padrão, a região de processamento é definida como a região padrão do conjunto de dados do BigQuery. É possível editar a região de processamento no arquivo
dataform.json
depois de criar o repositório. Para mais informações, consulte Definir as configurações do Dataform.- Conta de serviço
Conta de serviço associada ao repositório. Conta de serviço associada ao repositório. É possível selecionar a conta de serviço padrão do Dataform, uma conta de serviço associada ao seu projeto do Google Cloud ou inserir manualmente uma conta de serviço diferente. Por padrão, o Dataform usa uma conta de serviço derivada do número do projeto no seguinte formato:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
O Dataform usa a conta de serviço padrão para todas as operações do repositório. É possível usar uma conta de serviço diferente para executar fluxos de trabalho no seu repositório, mas a conta de serviço padrão ainda será usada para todas as outras operações do repositório.
Depois de criar um repositório, é possível conectá-lo ao GitHub ou ao GitLab.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs BigQuery and Dataform.
Funções exigidas
Para ter as permissões necessárias para criar e excluir um repositório,
peça ao administrador para conceder a você o
papel do IAM de Administrador do Dataform (roles/dataform.admin
) nos repositórios.
Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.
Também é possível conseguir as permissões necessárias usando papéis personalizados ou outros papéis predefinidos.
Para usar uma conta de serviço diferente da conta de serviço padrão do Dataform, conceda acesso à conta de serviço que não é padrão.
Criar um repositório do Dataform
Para criar um repositório do Dataform, siga estas etapas:
No console do Google Cloud, acesse a página Dataform.
Clique em Criar repositório.
Na página Criar repositório, no campo ID do repositório, insira um ID exclusivo.
Os IDs podem incluir apenas números, letras, hífens e sublinhados.
Na lista suspensa Região, selecione uma região do Dataform para armazenar o repositório e o conteúdo dele. Selecione a região do Dataform mais próxima da sua localização.
Para conferir uma lista de regiões disponíveis do Dataform, consulte Locais. A região do repositório não precisa corresponder ao local dos conjuntos de dados do BigQuery.
No arquivo
dataform.json
, é possível definir a região de processamento em que o Dataform processa seu código e armazena a saída das execuções. A região de processamento precisa corresponder ao local dos conjuntos de dados do BigQuery, mas não precisa corresponder à região do repositório. Para mais informações, consulte Definir configurações do Dataform.No menu suspenso Conta de serviço, selecione uma conta de serviço para o repositório.
No menu suspenso, selecione a conta de serviço padrão do Dataform ou qualquer conta de serviço associada ao projeto do Google Cloud a que você tenha acesso. Tenha em mente que as contas de serviço não padrão são usadas apenas para a execução do fluxo de trabalho. Todas as outras operações de repositório ainda são realizadas pela conta de serviço padrão do Dataform.
- Opcional: para selecionar uma conta de serviço que não aparece no menu suspenso, clique em Digitar manualmente e insira um ID.
Clique em Criar e em Concluído.
Editar a conta de serviço
É possível associar uma conta de serviço não padrão a um repositório do Dataform para execução de fluxos de trabalho. Todas as outras operações de repositório ainda são realizadas pela conta de serviço padrão do Dataform.
Para editar a conta de serviço de um repositório do Dataform, siga estas etapas:
No console do Google Cloud, acesse a página Dataform.
Selecione um repositório e clique em Configurações.
No campo Conta de serviço, clique em
Editar conta de serviço.No menu suspenso Conta de serviço, selecione uma conta de serviço para o repositório.
No menu suspenso, selecione a conta de serviço padrão do Dataform ou qualquer conta de serviço associada ao projeto do Google Cloud a que você tenha acesso.
- Opcional: para selecionar uma conta de serviço que não aparece no menu suspenso, clique em Digitar manualmente e insira um ID.
Clique em Save.
Excluir um repositório do Dataform
Para excluir um repositório e todo o conteúdo dele, siga estas etapas:
No console do Google Cloud, acesse a página Dataform.
Ao lado do repositório que você quer excluir, clique no menu Mais
e selecione Excluir.
Na janela Excluir repositório, insira o nome do repositório para confirmar a exclusão.
Clique em Excluir.
A seguir
Para saber como definir as configurações de processamento do Dataform, consulte Definir configurações do Dataform.
Para saber como vincular um repositório do Dataform a um provedor Git de terceiros, consulte Conectar-se a um repositório Git de terceiros.
Para saber como criar um espaço de trabalho de desenvolvimento, consulte Criar um espaço de trabalho.