Introduzione ai repository

Questo documento ti aiuta a comprendere il concetto di repository in Dataform.

Ogni repository Dataform ospita una raccolta di file SQLX e JavaScript che costituiscono il flusso di lavoro SQL, nonché file e pacchetti di configurazione Dataform. Interagisci con i contenuti del tuo repository in un'area di lavoro di sviluppo.

Dataform visualizza i repository nella pagina Dataform in ordine alfabetico di ID repository. Puoi ordinarli e filtrarli.

Vai a Dataform

Ogni repository Dataform è connesso a un account di servizio. Puoi selezionare un account di servizio quando crei un repository o modificare l'account di servizio in un secondo momento.

Per impostazione predefinita, Dataform utilizza un account di servizio derivato dal numero del progetto nel seguente formato:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform utilizza Git per registrare le modifiche e gestire le versioni dei file. Ogni repository Dataform corrisponde a un repository Git. Dopo aver creato un repository Dataform, puoi connetterlo a un repository GitHub, GitLab o Bitbucket remoto.

In un repository Dataform, Dataform archivia il codice del repository. In un repository connesso, il repository di terze parti archivia il codice del repository. Dataform interagisce con il repository di terze parti per consentirti di modificare ed eseguire i suoi contenuti in un'area di lavoro di sviluppo di Dataform.

Una pagina del repository Dataform è costituita dai seguenti componenti:

Scheda Aree di lavoro per lo sviluppo
Mostra le aree di lavoro di sviluppo create nel repository.
Scheda Configurazioni della release
Consente di ispezionare, creare, modificare ed eliminare le release.
Scheda Log di esecuzione del flusso di lavoro
Visualizza i log di esecuzione del flusso di lavoro Dataform.
Scheda Configurazioni del flusso di lavoro
Consente di ispezionare, creare, modificare ed eliminare le configurazioni del flusso di lavoro.
Scheda Impostazioni.
Mostra il nome e la posizione del repository. Per un repository connesso a un repository Git di terze parti, visualizza l'origine del repository di terze parti, il nome predefinito del ramo e il token secret. Mostra i pulsanti per connettere il repository a un repository Git di terze parti e per modificare la connessione Git.
Pulsante Crea area di lavoro di sviluppo
Consente di creare un'area di lavoro di sviluppo.

Dopo aver creato e inizializzato un'area di lavoro di sviluppo, puoi modificare il file delle impostazioni del flusso di lavoro per configurare le seguenti impostazioni Dataform del repository:

  • Il database predefinito (ID progetto Google Cloud)
  • Lo schema predefinito (ID set di dati BigQuery)
  • La località BigQuery predefinita
  • Schema predefinito (ID set di dati BigQuery) per le asserzioni
  • Il warehouse, che deve essere impostato su bigquery
  • Variabili definite dall'utente rese disponibili per il codice di progetto durante la compilazione

Per ulteriori informazioni sulle impostazioni del repository Dataform, consulta IProjectConfig nel riferimento principale di Dataform.

Passaggi successivi