Introdução aos repositórios

Neste documento, você vai entender o conceito de repositórios no Dataform.

Cada repositório do Dataform abriga uma coleção de arquivos SQLX e JavaScript que compõem o fluxo de trabalho do SQL, além de arquivos e pacotes de configuração do Dataform. Você interage com o conteúdo do repositório em um espaço de trabalho de desenvolvimento.

O Dataform exibe seus repositórios na página do Dataform na ordem alfabética dos IDs dos repositórios. Eles podem ser classificados e filtrados.

Acessar o Dataform

Cada repositório do Dataform está conectado a uma conta de serviço. É possível selecionar uma conta de serviço ao criar um repositório ou editar a conta de serviço mais tarde.

Por padrão, o Dataform usa uma conta de serviço derivada do número do projeto no seguinte formato:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

O Dataform usa o Git para registrar alterações e gerenciar versões de arquivos. Cada repositório do Dataform corresponde a um repositório Git. Depois de criar um repositório do Dataform, é possível conectá-lo a um repositório remoto do GitHub, GitLab ou Bitbucket.

Em um repositório do Dataform, o Dataform armazena o código do repositório. Em um repositório conectado, o repositório de terceiros armazena o código do repositório. O Dataform interage com o repositório de terceiros para permitir que você edite e execute o conteúdo em um espaço de trabalho de desenvolvimento do Dataform.

Uma página de repositório do Dataform consiste nos seguintes componentes:

Guia "Espaços de trabalho de desenvolvimento"
Exibe os espaços de trabalho de desenvolvimento criados no repositório.
Guia "Configurações da versão"
Permite inspecionar, criar, editar e excluir versões.
Guia "Registros de execução do fluxo de trabalho"
Exibe registros de execução de fluxo de trabalho do Dataform.
Guia "Configurações do fluxo de trabalho"
Permite inspecionar, criar, editar e excluir configurações do fluxo de trabalho
.
Guia "Configurações"
Exibe o nome e o local do repositório. Para um repositório conectado a um repositório Git de terceiros, exibe a origem do repositório de terceiros, o nome padrão da ramificação e o token secreto. Exibe os botões para conectar o repositório a um repositório Git de terceiros e editar a conexão Git.
Botão "Criar espaço de trabalho de desenvolvimento"
Permite criar um espaço de trabalho de desenvolvimento.

Depois de criar e inicializar um espaço de trabalho de desenvolvimento, é possível editar o arquivo de configurações do fluxo de trabalho para definir as seguintes configurações do Dataform do seu repositório:

  • O banco de dados padrão (ID do projeto do Google Cloud)
  • O esquema padrão (ID do conjunto de dados do BigQuery)
  • O local padrão do BigQuery
  • O esquema padrão (ID do conjunto de dados do BigQuery) para declarações
  • O warehouse, que precisa ser definido como bigquery
  • Variáveis definidas pelo usuário que são disponibilizadas para o código do projeto durante a compilação

Para mais informações sobre as configurações do repositório do Dataform, consulte IProjectConfig na referência principal do Dataform.

A seguir