Questo documento ti aiuta a comprendere il concetto di repository in Dataform.
Ogni repository Dataform contiene una raccolta di file SQLX e JavaScript che costituiscono il flusso di lavoro SQL, nonché file e pacchetti di configurazione Dataform. Puoi interagire con i contenuti del tuo repository in un'area di lavoro di sviluppo.
Dataform mostra i tuoi repository nella pagina Dataform in ordine alfabetico degli ID repository. Puoi ordinarli e filtrarli.
Ogni repository Dataform è connesso a un account di servizio. Puoi selezionare un account di servizio quando crei un repository o modifichi l'account di servizio in un secondo momento.
Per impostazione predefinita, Dataform utilizza un account di servizio derivato dal numero di progetto nel seguente formato:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform utilizza Git per registrare le modifiche e gestire le versioni dei file. Ogni repository Dataform corrisponde a un repository Git. Dopo aver creato un repository Dataform, puoi connetterlo a un repository GitHub, GitLab o Bitbucket remoto.
In un repository Dataform, Dataform archivia il codice del repository. In un repository connesso, il repository di terze parti archivia il codice del repository. Dataform interagisce con il repository di terze parti per consentirti di modificare ed eseguire i suoi contenuti in un'area di lavoro di sviluppo Dataform.
Una pagina del repository Dataform è composta dai seguenti componenti:
- Scheda Aree di lavoro di sviluppo
- Mostra le aree di lavoro di sviluppo create nel repository.
- Scheda Configurazioni release
- Ti consente di esaminare, creare, modificare ed eliminare le release.
- Scheda Log di esecuzione del flusso di lavoro
- Visualizza i log di esecuzione del flusso di lavoro Dataform.
- Scheda Configurazioni del flusso di lavoro
- Consente di ispezionare, creare, modificare ed eliminare configurazioni dei flussi di lavoro.
- Scheda Impostazioni
- Mostra il nome e la posizione del repository. Per un repository connesso a un repository Git di terze parti, mostra l'origine del repository di terze parti, il nome del ramo predefinito e il token secret. Mostra i pulsanti per connettere il repository a un repository Git di terze parti e modificare la connessione Git.
- Pulsante Crea area di lavoro di sviluppo
- Consente di creare un'area di lavoro di sviluppo.
Dopo aver creato e inizializzato un'area di lavoro di sviluppo, puoi
modificare il file dataform.json
per configurare
le seguenti impostazioni Dataform del tuo repository:
- Il database predefinito (ID progetto Google Cloud)
- Lo schema predefinito (ID set di dati BigQuery)
- La località BigQuery predefinita
- Lo schema predefinito (ID set di dati BigQuery) per le asserzioni
- Il warehouse, che deve essere impostato su
bigquery
- Variabili definite dall'utente rese disponibili per il codice del progetto durante la compilazione
Per ulteriori informazioni sulle impostazioni del repository Dataform, consulta IProjectConfig nel riferimento principale di Dataform.
Passaggi successivi
- Per scoprire come creare e inizializzare un'area di lavoro, vedi Creare un'area di lavoro.
- Per informazioni su come configurare le impostazioni del repository Dataform, consulta Configurare le impostazioni di Dataform.
- Per scoprire come connettere un repository Dataform a un repository Git di terze parti, consulta Connettersi a un repository Git di terze parti.
- Per scoprire come visualizzare i log di esecuzione dei flussi di lavoro, consulta Monitorare i log di esecuzione.
- Per informazioni su come creare release di compilazione Dataform, consulta Creare una release di compilazione.
- Per scoprire di più su come le dimensioni del repository influenzino lo sviluppo in Dataform, consulta Panoramica delle dimensioni del repository.
- Per scoprire come pianificare le esecuzioni di Dataform con le configurazioni dei flussi di lavoro, consulta Pianificare le esecuzioni con configurazioni dei flussi di lavoro.
- Per saperne di più sulla suddivisione di un repository in Dataform, consulta Introduzione alla suddivisione dei repository.