Source Control Management in Cloud Data Fusion consente di gestire le versioni della pipeline tramite i repository GitHub.
Integrando Cloud Data Fusion con GitHub puoi:
- Gestisci le tue pipeline in un repository Git centrale.
- Rivedi e controlla le modifiche della pipeline.
- Annulla le modifiche alla pipeline.
- Collaborare efficacemente con il team, garantendo al contempo il controllo centrale.
Prima di iniziare
Limitazioni
- Cloud Data Fusion supporta solo GitHub e non altri provider Git.
- OAuth non è supportato.
- Source Control Management offre scalabilità e supporto per le prestazioni ottimali nelle istanze abilitate per RBAC.
- Source Control Management supporta solo le pipeline in modalità batch.
- La gestione del controllo del codice sorgente non supporta le configurazioni delle pipeline.
- La dimensione predefinita del limite del repository collegato è 5 GB.
Ruoli e autorizzazioni richiesti
Operazione | datafusion.accessor | visualizzatore dati | datafusion.operator | datafusion.developer | editor datafusion.editor | datafusion.admin |
---|---|---|---|---|---|---|
Configura repository di controllo del codice sorgente | No | No | Sì | No | Sì | Sì |
Esegui il push o il pull della pipeline dallo spazio dei nomi | No | No | Sì | Sì | Sì | Sì |
Configura un repository Git
Cloud Data Fusion consente di configurare un repository Git per ogni spazio dei nomi. Dopo aver configurato il repository Git per uno spazio dei nomi, puoi eseguire il push delle pipeline distribuite dallo spazio dei nomi di Cloud Data Fusion al repository Git o eseguire il deployment delle pipeline dal repository Git allo spazio dei nomi di Cloud Data Fusion.
Puoi collegare un repository Git a più spazi dei nomi, ma uno spazio dei nomi può essere associato a un solo repository Git.
Collega un repository Git con uno spazio dei nomi
Per collegare un repository Git a uno spazio dei nomi, segui questi passaggi:
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su Amministratore dello spazio dei nomi.
- Nella pagina Amministratore dello spazio dei nomi, fai clic sulla scheda Gestione del controllo del codice sorgente.
- Fai clic su Collega repository.
Inserisci i seguenti dettagli:
- Provider (obbligatorio)
- (Obbligatorio) URL repository
- (Facoltativo) Ramo predefinito
- (Facoltativo) Prefisso percorso
- Tipo di autenticazione (obbligatorio)
- Nome token (obbligatorio)
- Token (obbligatorio)
- (Facoltativo) Nome utente
Per ulteriori informazioni sulla creazione di un repository Git, consulta la sezione Creare un repository.
Per ulteriori informazioni sui token di accesso personali, consulta Creazione di un token di accesso personale e Creazione di un token di accesso personale granulare.
Fai clic su Convalida. Attendi che la connessione venga verificata.
Al termine della configurazione, fai clic su Salva e chiudi per confermare le modifiche alla configurazione.
Aggiorna la configurazione Git
Per aggiornare una configurazione Git esistente:
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su Amministratore dello spazio dei nomi.
- Nella pagina Amministratore dello spazio dei nomi, fai clic sulla scheda Gestione del controllo del codice sorgente.
- Per la configurazione Git che vuoi aggiornare, fai clic su > Modifica.
- Aggiorna i dettagli del repository Git in base alle tue esigenze e fai clic su Convalida.
- Fai clic su Salva e chiudi per salvare la nuova configurazione.
Elimina la configurazione Git
Per eliminare la configurazione Git da uno spazio dei nomi, procedi nel seguente modo:
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su Amministratore dello spazio dei nomi.
- Nella pagina Amministratore dello spazio dei nomi, fai clic sulla scheda Gestione del controllo del codice sorgente.
- Per la configurazione Git che vuoi eliminare, fai clic su > Elimina.
Sincronizza pipeline
Dopo aver configurato un repository Git con uno spazio dei nomi, puoi utilizzare l'opzione Sync Pipelines per eseguire il push delle pipeline da Cloud Data Fusion a GitHub o per il pull e il deployment di pipeline da GitHub a Cloud Data Fusion.
Esegui il push delle pipeline da Cloud Data Fusion a GitHub
Per sincronizzare una pipeline di cui è stato eseguito il deployment da uno spazio dei nomi a GitHub, segui questi passaggi:
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su Amministratore dello spazio dei nomi.
- Nella pagina Amministratore dello spazio dei nomi, fai clic sulla scheda Gestione del controllo del codice sorgente.
- Trova il repository Git con cui vuoi effettuare la sincronizzazione e fai clic su Sync Pipelines (Sincronizza pipeline).
- Fai clic sulla scheda Pipeline locali.
Cerca o seleziona la pipeline di cui vuoi eseguire il push a GitHub. Puoi eseguire il push di una sola pipeline alla volta.
Se viene eseguito il push o il pull della versione più recente della pipeline da GitHub, lo stato Connesso a Git mostra
Connected
. Se la pipeline non è mai stata trasferita a GitHub, lo stato Connessione a Git è vuoto (-
).Se esegui il deployment di una versione più recente di una pipeline già sincronizzata con GitHub, lo stato Connesso a Git passa da
Connected
a vuoto (-
).Fai clic su Invia al telecomando.
Inserisci un Messaggio di commit e fai clic su OK.
Al termine della sincronizzazione, viene visualizzato un segno di spunta verde nella pagina Pipeline locali e lo stato Collegato a Git per la pipeline sottoposta a push mostra
Connected
. Il percorso del repository Git è collegato alla pipeline.Se il push non va a buon fine, controlla la pipeline in GitHub per verificare se è la versione più recente.
Puoi anche eseguire il push delle pipeline di cui è stato eseguito il deployment da uno spazio dei nomi a GitHub nei seguenti modi:
Dalla pagina dei dettagli della pipeline
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su List (Elenco).
- Fai clic sulla pipeline di cui vuoi eseguire il push a GitHub.
- Nella pagina dei dettagli della pipeline, fai clic su Azioni > Invia al telecomando.
- Inserisci un Messaggio di commit e fai clic su OK.
Dalla pagina Elenco
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su List (Elenco).
- Per la pipeline che vuoi eseguire il push a GitHub, fai clic su > Trasferisci al telecomando.
- Inserisci un Messaggio di commit e fai clic su OK.
Esegui il pull delle pipeline GitHub in Cloud Data Fusion
Se gestisci manualmente le versioni della pipeline in GitHub, puoi eseguire il deployment e la distribuzione delle pipeline GitHub in Cloud Data Fusion.
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su Amministratore dello spazio dei nomi.
- Nella pagina Amministratore dello spazio dei nomi, fai clic sulla scheda Gestione del controllo del codice sorgente.
- Trova il repository Git con cui vuoi effettuare la sincronizzazione e fai clic su Sync Pipelines.
- Fai clic sulla scheda Pipeline remote. Vengono visualizzate tutte le pipeline archiviate in GitHub.
- Cerca o seleziona la pipeline da cui vuoi eseguire il pull da GitHub a Cloud Data Fusion. Puoi eseguire il pull di una sola pipeline alla volta.
Fai clic su Trascina allo spazio dei nomi.
Cloud Data Fusion cerca i file JSON nel percorso configurato e ne esegue il pull e il deployment come pipeline in Cloud Data Fusion.
Al termine della sincronizzazione, viene visualizzato un segno di spunta verde nella pagina Pipeline remote. Cloud Data Fusion esegue automaticamente il deployment della pipeline.
Per eseguire una pipeline, vai alla pagina Elenco, fai clic su Deployment eseguito ed eseguilo.
Puoi anche eseguire il pull delle pipeline remote da GitHub a uno spazio dei nomi utilizzando i seguenti metodi:
Dalla pagina dei dettagli della pipeline
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su List (Elenco).
- Fai clic sulla pipeline da cui vuoi eseguire il pull da GitHub.
- Nella pagina dei dettagli della pipeline, fai clic su Azioni > Trascina verso lo spazio dei nomi.
Dalla visualizzazione List (Elenco).
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su List (Elenco).
- Per la pipeline che vuoi estrarre da GitHub, fai clic su > Trascina verso lo spazio dei nomi.
Pulsante
- Nell'interfaccia web di Cloud Data Fusion, fai clic su Menu.
- Fai clic su List (Elenco).
- Fai clic su .
- Fai clic su Rimuovi dal telecomando.
- Cerca o seleziona la pipeline da cui vuoi eseguire il pull da GitHub a Cloud Data Fusion. Puoi eseguire il pull di una sola pipeline alla volta.
- Fai clic su Trascina allo spazio dei nomi.