Questo documento mostra come creare un repository, impostare e modificare l'account di servizio del repository ed eliminare un repository in Dataform.
Quando crei un repository Dataform, devi configurare le seguenti impostazioni per il repository:
- ID repository
- Un ID univoco del repository. Gli ID possono includere solo numeri, lettere, trattini e trattini bassi.
- Regione
Regione Dataform per l'archiviazione del repository e dei suoi contenuti.
Questa regione di archiviazione può essere diversa da quella di elaborazione in cui Dataform elabora il codice e archivia l'output delle esecuzioni. Per impostazione predefinita, la regione di elaborazione è impostata sulla regione predefinita del set di dati BigQuery. Puoi modificare la regione di elaborazione nel file
dataform.json
dopo aver creato il repository. Per ulteriori informazioni, consulta Configurare le impostazioni di Dataform.- Account di servizio
Account di servizio associato al repository. Puoi selezionare l'account di servizio Dataform predefinito, un account di servizio associato al progetto Google Cloud o inserire manualmente un account di servizio diverso. Per impostazione predefinita, Dataform utilizza un account di servizio derivato dal numero del progetto nel seguente formato:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform utilizza l'account di servizio predefinito per tutte le operazioni del repository. Puoi utilizzare un account di servizio diverso per eseguire i flussi di lavoro nel repository, ma l'account di servizio predefinito viene ancora utilizzato per tutte le altre operazioni sul repository.
- Crittografia
Metodo di crittografia per il repository. Puoi utilizzare la crittografia predefinita o applicare una chiave di crittografia Cloud KMS gestita dal cliente. Per saperne di più sull'utilizzo delle chiavi di crittografia gestite dal cliente (CMEK) in Dataform, consulta Utilizzare le chiavi di crittografia gestite dal cliente.
Dopo aver creato un repository, puoi connetterlo a GitHub o GitLab.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API BigQuery and Dataform.
-
Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API BigQuery and Dataform.
- Per utilizzare la crittografia CMEK per il repository, abilita la crittografia CMEK dei repository Dataform.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare ed eliminare un repository,
chiedi all'amministratore di concederti il ruolo IAM
Amministratore Dataform (roles/dataform.admin
) per i repository.
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.
Potresti anche essere in grado di ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Per utilizzare un account di servizio diverso da quello predefinito di Dataform, concedi l'accesso all'account di servizio personalizzato.
Crea un repository
Per creare un repository Dataform:
Nella console Google Cloud, vai alla pagina Dataform.
Fai clic su Crea repository.
Nella pagina Crea repository, inserisci un ID univoco nel campo ID repository.
Gli ID possono includere solo numeri, lettere, trattini e trattini bassi.
Nell'elenco a discesa Regione, seleziona una regione Dataform per archiviare il repository e i suoi contenuti. Seleziona la regione Dataform più vicina alla tua sede.
Per un elenco delle regioni Dataform disponibili, consulta Località. La regione del repository non deve necessariamente corrispondere alla località dei set di dati BigQuery.
Nel file
dataform.json
, puoi impostare la regione di elaborazione in cui Dataform elabora il codice e archivia l'output delle esecuzioni. La regione di elaborazione deve corrispondere alla località dei set di dati BigQuery, ma non deve necessariamente corrispondere a quella del repository. Per maggiori informazioni, consulta Configurare le impostazioni di Dataform.Nel menu a discesa Account di servizio, seleziona un account di servizio per il repository.
Nel menu a discesa, puoi selezionare l'account di servizio Dataform predefinito o qualsiasi account di servizio associato al progetto Google Cloud a cui hai accesso. Gli account di servizio personalizzati vengono utilizzati solo per l'esecuzione del flusso di lavoro. Tutte le altre operazioni sul repository vengono comunque eseguite dall'account di servizio Dataform predefinito.
- (Facoltativo) Per selezionare un account di servizio non visualizzato nel menu a discesa, fai clic su Inserisci manualmente e inserisci un ID account di servizio.
Nella sezione Crittografia, seleziona il metodo di crittografia per il repository.
- Per utilizzare la crittografia predefinita, seleziona l'opzione Chiave di crittografia gestita da Google.
Per utilizzare CMEK, seleziona l'opzione Chiavi di crittografia gestite dal cliente (CMEK).
- Nel menu a discesa Seleziona una chiave gestita dal cliente, seleziona una chiave CMEK per il repository.
Per saperne di più, consulta Limitazioni CMEK di Dataform.
Fai clic su Crea e poi su Fine.
Modifica l'account di servizio
Puoi associare un account di servizio personalizzato a un repository Dataform per l'esecuzione del flusso di lavoro. Tutte le altre operazioni sul repository vengono comunque eseguite dall'account di servizio Dataform predefinito.
Per modificare l'account di servizio per un repository Dataform:
Nella console Google Cloud, vai alla pagina Dataform.
Seleziona un repository e fai clic su Impostazioni.
Nel campo Account di servizio, fai clic su
Modifica account di servizio.Nel menu a discesa Account di servizio, seleziona un account di servizio per il repository.
Nel menu a discesa, puoi selezionare l'account di servizio Dataform predefinito o qualsiasi account di servizio associato al progetto Google Cloud a cui hai accesso.
- (Facoltativo) Per selezionare un account di servizio non visualizzato nel menu a discesa, fai clic su Inserisci manualmente e inserisci un ID account di servizio.
Fai clic su Salva.
Elimina un repository
Per eliminare un repository e tutti i suoi contenuti:
Nella console Google Cloud, vai alla pagina Dataform.
In corrispondenza del repository che vuoi eliminare, fai clic sul menu
Altro, quindi seleziona Elimina.Nella finestra Elimina repository, inserisci il nome del repository per confermare l'eliminazione.
Fai clic su Elimina.
Passaggi successivi
Per scoprire come configurare le impostazioni di elaborazione di Dataform, consulta Configurare le impostazioni di Dataform.
Per scoprire come collegare un repository Dataform a un provider Git di terze parti, consulta Connettersi a un repository Git di terze parti.
Per scoprire di più sull'utilizzo di CMEK in Dataform, vedi Utilizzare chiavi di crittografia gestite dal cliente.
Per scoprire come creare un'area di lavoro di sviluppo, consulta Creare un'area di lavoro.