Neste documento, você vai entender o conceito de repositórios no Dataform.
Cada repositório do Dataform abriga uma coleção de arquivos SQLX e JavaScript que compõem o fluxo de trabalho do SQL, além de arquivos e pacotes de configuração do Dataform. Você interage com o conteúdo do repositório em um espaço de trabalho de desenvolvimento.
O Dataform exibe seus repositórios na página do Dataform na ordem alfabética dos IDs dos repositórios. Eles podem ser classificados e filtrados.
Cada repositório do Dataform está conectado a uma conta de serviço. É possível selecionar uma conta de serviço ao criar um repositório ou editar a conta de serviço mais tarde.
Por padrão, o Dataform usa uma conta de serviço derivada do número do projeto no seguinte formato:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
O Dataform usa o Git para registrar alterações e gerenciar versões de arquivos. Cada repositório do Dataform corresponde a um repositório Git. Depois de criar um repositório do Dataform, é possível conectá-lo a um repositório remoto do GitHub, GitLab ou Bitbucket.
Em um repositório do Dataform, o Dataform armazena o código do repositório. Em um repositório conectado, o repositório de terceiros armazena o código do repositório. O Dataform interage com o repositório de terceiros para permitir que você edite e execute o conteúdo em um espaço de trabalho de desenvolvimento do Dataform.
Uma página de repositório do Dataform consiste nos seguintes componentes:
- Guia "Espaços de trabalho de desenvolvimento"
- Exibe os espaços de trabalho de desenvolvimento criados no repositório.
- Guia "Configurações da versão"
- Permite inspecionar, criar, editar e excluir versões.
- Guia "Registros de execução do fluxo de trabalho"
- Exibe registros de execução de fluxo de trabalho do Dataform.
- Guia "Configurações do fluxo de trabalho"
- Permite inspecionar, criar, editar e excluir configurações do fluxo de trabalho .
- Guia "Configurações"
- Exibe o nome e o local do repositório. Para um repositório conectado a um repositório Git de terceiros, exibe a origem do repositório de terceiros, o nome padrão da ramificação e o token secreto. Exibe os botões para conectar o repositório a um repositório Git de terceiros e editar a conexão Git.
- Botão "Criar espaço de trabalho de desenvolvimento"
- Permite criar um espaço de trabalho de desenvolvimento.
Depois de criar e inicializar um espaço de trabalho de desenvolvimento, é possível editar o arquivo de configurações do fluxo de trabalho para definir as seguintes configurações do Dataform do seu repositório:
- O banco de dados padrão (ID do projeto do Google Cloud)
- O esquema padrão (ID do conjunto de dados do BigQuery)
- O local padrão do BigQuery
- O esquema padrão (ID do conjunto de dados do BigQuery) para declarações
- O warehouse, que precisa ser definido como
bigquery
- Variáveis definidas pelo usuário que são disponibilizadas para o código do projeto durante a compilação
Para mais informações sobre as configurações do repositório do Dataform, consulte IProjectConfig na referência principal do Dataform.
A seguir
- Para saber como criar e inicializar um espaço de trabalho, consulte Criar um espaço de trabalho.
- Para saber como definir as configurações do repositório do Dataform, consulte Definir as configurações do Dataform.
- Para saber como conectar um repositório do Dataform a um repositório Git de terceiros, consulte Conectar-se a um repositório Git de terceiros.
- Para saber como visualizar os registros de execução do fluxo de trabalho, consulte Monitorar registros de execução.
- Para aprender a criar versões de compilação do Dataform, consulte Criar uma versão de compilação.
- Para saber mais sobre como o tamanho do repositório afeta o desenvolvimento no Dataform, consulte a Visão geral do tamanho do repositório.
- Para saber como programar execuções do Dataform com configurações de fluxo de trabalho, consulte Programar execuções com configurações de fluxo de trabalho.
- Para saber mais sobre como dividir um repositório no Dataform, consulte Introdução à divisão de repositórios.