Introduzione ai repository

Questo documento ti aiuta a comprendere il concetto di repository in Dataform.

Ogni repository Dataform ospita una raccolta di codice SQLX e JavaScript che costituiscono il flusso di lavoro SQL, nonché di configurazione e pacchetti. interagisci con i contenuti in un'area di lavoro di sviluppo.

Dataform visualizza i tuoi repository nella pagina Dataform in in ordine alfabetico degli ID repository. Puoi ordinarli e filtrarli.

Vai a Dataform

Ogni repository Dataform è connesso a un account di servizio. Puoi seleziona un account di servizio quando crei un repository, oppure modifica l'account di servizio in un secondo momento.

Per impostazione predefinita, Dataform utilizza un account di servizio derivato numero di progetto nel seguente formato:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform utilizza Git per registrare le modifiche e gestire le versioni dei file. Ogni repository Dataform corrisponde a un repository Git. Dopo aver creato un repository Dataform, puoi connetterlo in un repository remoto GitHub, GitLab o Bitbucket.

In un repository Dataform, Dataform archivia il codice del repository. In un repository connesso, il repository di terze parti archivia il codice del repository. Dataform interagisce con il repository di terze parti per consentirti di modificare ed eseguirne i contenuti in un'area di lavoro di sviluppo Dataform.

Una pagina del repository Dataform è costituita dai seguenti componenti:

Scheda Aree di lavoro per lo sviluppo
Mostra le aree di lavoro di sviluppo create nel repository.
Scheda Configurazioni della release
Consente di ispezionare, creare, modificare ed eliminare release.
Scheda Log di esecuzione del flusso di lavoro
Visualizza i log di esecuzione del flusso di lavoro Dataform.
Scheda Configurazioni del flusso di lavoro
Consente di ispezionare, creare, modificare ed eliminare configurazioni del flusso di lavoro.
Scheda Impostazioni.
Mostra il nome e la posizione del repository. Per un repository connesso a un repository Git di terze parti, mostra l'origine del repository di terze parti, il nome del ramo predefinito e il token secret. Visualizza i pulsanti per connettere il repository a una terza parte repository Git e modificare la connessione Git.
Pulsante Crea area di lavoro di sviluppo
Consente di creare un'area di lavoro di sviluppo.

Dopo aver creato e inizializzato un'area di lavoro di sviluppo, puoi: modifica il file delle impostazioni del flusso di lavoro per configurare le seguenti impostazioni Dataform del repository:

  • Il database predefinito (ID progetto Google Cloud)
  • Lo schema predefinito (ID set di dati BigQuery)
  • La località BigQuery predefinita
  • Schema predefinito (ID set di dati BigQuery) per le asserzioni
  • Il warehouse, che deve essere impostato su bigquery
  • Variabili definite dall'utente rese disponibili per il codice di progetto durante la compilazione

Per saperne di più sulle impostazioni del repository Dataform, consulta IProjectConfig nel riferimento principale di Dataform.

Passaggi successivi