Questo documento ti aiuta a comprendere il concetto di repository in Dataform.
Ogni repository Dataform ospita una raccolta di codice SQLX e JavaScript che costituiscono il flusso di lavoro SQL, nonché di configurazione e pacchetti. interagisci con i contenuti in un'area di lavoro di sviluppo.
Dataform visualizza i tuoi repository nella pagina Dataform in in ordine alfabetico degli ID repository. Puoi ordinarli e filtrarli.
Ogni repository Dataform è connesso a un account di servizio. Puoi seleziona un account di servizio quando crei un repository, oppure modifica l'account di servizio in un secondo momento.
Per impostazione predefinita, Dataform utilizza un account di servizio derivato numero di progetto nel seguente formato:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform utilizza Git per registrare le modifiche e gestire le versioni dei file. Ogni repository Dataform corrisponde a un repository Git. Dopo aver creato un repository Dataform, puoi connetterlo in un repository remoto GitHub, GitLab o Bitbucket.
In un repository Dataform, Dataform archivia il codice del repository. In un repository connesso, il repository di terze parti archivia il codice del repository. Dataform interagisce con il repository di terze parti per consentirti di modificare ed eseguirne i contenuti in un'area di lavoro di sviluppo Dataform.
Una pagina del repository Dataform è costituita dai seguenti componenti:
- Scheda Aree di lavoro per lo sviluppo
- Mostra le aree di lavoro di sviluppo create nel repository.
- Scheda Configurazioni della release
- Consente di ispezionare, creare, modificare ed eliminare release.
- Scheda Log di esecuzione del flusso di lavoro
- Visualizza i log di esecuzione del flusso di lavoro Dataform.
- Scheda Configurazioni del flusso di lavoro
- Consente di ispezionare, creare, modificare ed eliminare configurazioni del flusso di lavoro.
- Scheda Impostazioni.
- Mostra il nome e la posizione del repository. Per un repository connesso a un repository Git di terze parti, mostra l'origine del repository di terze parti, il nome del ramo predefinito e il token secret. Visualizza i pulsanti per connettere il repository a una terza parte repository Git e modificare la connessione Git.
- Pulsante Crea area di lavoro di sviluppo
- Consente di creare un'area di lavoro di sviluppo.
Dopo aver creato e inizializzato un'area di lavoro di sviluppo, puoi: modifica il file delle impostazioni del flusso di lavoro per configurare le seguenti impostazioni Dataform del repository:
- Il database predefinito (ID progetto Google Cloud)
- Lo schema predefinito (ID set di dati BigQuery)
- La località BigQuery predefinita
- Schema predefinito (ID set di dati BigQuery) per le asserzioni
- Il warehouse, che deve essere impostato su
bigquery
- Variabili definite dall'utente rese disponibili per il codice di progetto durante la compilazione
Per saperne di più sulle impostazioni del repository Dataform, consulta IProjectConfig nel riferimento principale di Dataform.
Passaggi successivi
- Per scoprire come creare e inizializzare un'area di lavoro, vedi Crea uno spazio di lavoro.
- Per scoprire come configurare le impostazioni del repository Dataform, consulta Configura le impostazioni di Dataform.
- Scopri come connettere un repository Dataform a un Git di terze parti consulta Connettersi a un repository Git di terze parti.
- Per scoprire come visualizzare i log di esecuzione del flusso di lavoro, consulta Monitora i log di esecuzione.
- Per scoprire come creare release di compilazione Dataform, consulta Crea una release compilation.
- Per saperne di più su come le dimensioni del repository influiscono sullo sviluppo in Dataform, consulta la Panoramica delle dimensioni del repository.
- Per scoprire come pianificare le esecuzioni Dataform con il flusso di lavoro configurazioni, consulta Pianificare le esecuzioni con configurazioni del flusso di lavoro.
- Per scoprire di più sulla suddivisione di un repository in Dataform, consulta Introduzione alla suddivisione dei repository.