Introduzione ai repository

Questo documento ti aiuta a comprendere il concetto di repository in Dataform.

Ogni repository Dataform contiene una raccolta di file SQLX e JavaScript che costituiscono il flusso di lavoro SQL, nonché file e pacchetti di configurazione Dataform. Puoi interagire con i contenuti del tuo repository in un'area di lavoro di sviluppo.

Dataform mostra i tuoi repository nella pagina Dataform in ordine alfabetico degli ID repository. Puoi ordinarli e filtrarli.

Vai a Dataform

Ogni repository Dataform è connesso a un account di servizio. Puoi selezionare un account di servizio quando crei un repository o modifichi l'account di servizio in un secondo momento.

Per impostazione predefinita, Dataform utilizza un account di servizio derivato dal numero di progetto nel seguente formato:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform utilizza Git per registrare le modifiche e gestire le versioni dei file. Ogni repository Dataform corrisponde a un repository Git. Dopo aver creato un repository Dataform, puoi connetterlo a un repository GitHub, GitLab o Bitbucket remoto.

In un repository Dataform, Dataform archivia il codice del repository. In un repository connesso, il repository di terze parti archivia il codice del repository. Dataform interagisce con il repository di terze parti per consentirti di modificare ed eseguire i suoi contenuti in un'area di lavoro di sviluppo Dataform.

Una pagina del repository Dataform è composta dai seguenti componenti:

Scheda Aree di lavoro di sviluppo
Mostra le aree di lavoro di sviluppo create nel repository.
Scheda Configurazioni release
Ti consente di esaminare, creare, modificare ed eliminare le release.
Scheda Log di esecuzione del flusso di lavoro
Visualizza i log di esecuzione del flusso di lavoro Dataform.
Scheda Configurazioni del flusso di lavoro
Consente di ispezionare, creare, modificare ed eliminare configurazioni dei flussi di lavoro.
Scheda Impostazioni
Mostra il nome e la posizione del repository. Per un repository connesso a un repository Git di terze parti, mostra l'origine del repository di terze parti, il nome del ramo predefinito e il token secret. Mostra i pulsanti per connettere il repository a un repository Git di terze parti e modificare la connessione Git.
Pulsante Crea area di lavoro di sviluppo
Consente di creare un'area di lavoro di sviluppo.

Dopo aver creato e inizializzato un'area di lavoro di sviluppo, puoi modificare il file dataform.json per configurare le seguenti impostazioni Dataform del tuo repository:

  • Il database predefinito (ID progetto Google Cloud)
  • Lo schema predefinito (ID set di dati BigQuery)
  • La località BigQuery predefinita
  • Lo schema predefinito (ID set di dati BigQuery) per le asserzioni
  • Il warehouse, che deve essere impostato su bigquery
  • Variabili definite dall'utente rese disponibili per il codice del progetto durante la compilazione

Per ulteriori informazioni sulle impostazioni del repository Dataform, consulta IProjectConfig nel riferimento principale di Dataform.

Passaggi successivi