Gestire l'amministrazione di Studio

Questa pagina illustra le funzionalità di amministrazione fornite da Studio di Cloud Data Fusion per gestire le configurazioni. Cloud Data Fusion segue una gerarchia, in cui ogni istanza può avere più spazi dei nomi. Da Cloud Data Fusion Studio, gli amministratori possono gestire centralmente tutti gli spazi dei nomi o gestirli singolarmente. Cloud Data Fusion Studio fornisce il sistema e lo spazio dei nomi seguenti i controlli di sicurezza.

Amministrazione di sistema

Se fai clic su Amministratore di sistema in Studio di Cloud Data Fusion, vengono visualizzate le seguenti schede:

  • La scheda Gestione: visualizza lo stato di integrità di vari Cloud Data Fusion. Puoi anche visualizzare i log per i servizi di machine learning.
  • Scheda Configurazione: crea, visualizza e modifica i seguenti controlli:

I provisioner sono responsabili della creazione, dell'inizializzazione e dell'eliminazione del dell'ambiente cloud in cui vengono eseguite le pipeline. Ogni provider espone un insieme di configurazioni utilizzate per controllare il tipo di cluster creato ed eliminato. Provisioner diversi creano diversi tipi di cluster.

Ogni profilo di calcolo ha un ambito: sistema o utente. Puoi utilizzare un profilo di calcolo del sistema per tutti gli spazi dei nomi sottostanti. I profili di calcolo utente esistono all'interno di uno spazio dei nomi e solo le pipeline in quello spazio dei nomi possono utilizzarli.

Nella scheda Configurazioni dell'amministratore di sistema, puoi creare un modello profilo di calcolo applicato a tutti gli spazi dei nomi. Cloud Data Fusion e assegna un profilo di computing predefinito.

Quando crei un profilo di computing, selezioni il provisioner, ovvero per creare e configurare i dettagli del runtime Cloud.

Preferenze di sistema

Le preferenze sono configurazioni predefinite che si applicano a vari livelli all'interno di Cloud Data Fusion, inclusi il sistema stesso, gli spazi dei nomi, le applicazioni (che contengono pipeline) e i singoli programmi all'interno delle pipeline. Le preferenze consentono di impostare valori predefiniti per le configurazioni più utilizzate. Questi i valori predefiniti possono essere ereditati da pipeline e programmi a livelli inferiori, di configurazione ripetitive. Per ulteriori informazioni, consulta Gestire macro, preferenze e argomenti di runtime.

Azione chiamata HTTP

L'azione di chiamata HTTP nella pagina Amministrazione sistema ti consente di interagire con l'API di Cloud Data Fusion o potenzialmente con altre API di servizi Google Cloud direttamente dall'interfaccia di Cloud Data Fusion Studio. Tuttavia, per creando pipeline di elaborazione dati con origini dati esterne, utilizza invece plug-in HTTP e la relativa chiamata HTTP Executor all'interno delle tue pipeline per soluzione completa. È leggermente diversa dall'azione di chiamata HTTP, ma i concetti di base sono simili.

Configurazioni e casi d'uso

L'azione di chiamata HTTP viene utilizzata principalmente per attività amministrative o ai fini della configurazione all'interno di Cloud Data Fusion. Ti consente di interagire con l'API Cloud Data Fusion o con altri servizi Google Cloud che espongono un'API HTTP, direttamente da Cloud Data Fusion Studio.

Configurazioni

Puoi definire i seguenti dettagli per una chiamata HTTP:

  • URL: l'endpoint di destinazione del servizio web a cui vuoi chiamata.
  • Method (Metodo): il metodo HTTP da utilizzare, ad esempio GET, POST o PUT.
  • (Facoltativo) Intestazioni: eventuali intestazioni personalizzate richieste per la richiesta.
  • (Facoltativo) Corpo: i dati da inviare nel corpo della richiesta, ad esempio per le chiamate POST e PUT.

Puoi quindi eseguire la chiamata HTTP definita e visualizzare la risposta dal in Cloud Data Fusion Studio.

Casi d'uso
  • Testa le chiamate API Cloud Data Fusion. Puoi utilizzare l'azione di chiamata HTTP per testare o esplorare le funzionalità dell'API Cloud Data Fusion direttamente dall'interfaccia web. Questa azione può essere utile per comprendere il comportamento dell'API o risolvere potenziali problemi.
  • Gestisci gli spazi dei nomi (avanzato). Sebbene esista un'interfaccia utente dedicata per la gestione dei nomi di spazio, l'azione di chiamata HTTP può essere utilizzata per attività avanzate effettuando chiamate direttamente all'API Cloud Data Fusion per la creazione, l'eliminazione o la configurazione dei nomi di spazio.
  • Interazione con altri servizi Google Cloud (limitata). Se altri servizi Google Cloud che utilizzi dispongono di una documentazione API HTTP, puoi utilizzare la chiamata HTTP per interagire anche se si tratta di un caso d'uso non comune.
Considerazioni importanti
  • Sicurezza: fai attenzione quando utilizzi l'azione di chiamata HTTP, soprattutto con i dati sensibili o le chiamate API Cloud Data Fusion, potrebbero influire sul tuo ambiente. Assicurati di comprendere le implicazioni di ogni chiamata API prima di eseguirla.
  • Limitazioni: l'azione di chiamata HTTP è principalmente per attività amministrative e test. Non è progettato per creare pipeline di elaborazione dati complesse che comportano la manipolazione dei dati in Cloud Data Fusion.
  • Alternativa per pipeline: per integrare origini dati esterne nelle pipeline di dati, puoi utilizzare il plug-in HTTP e i relativi esecutore di chiamata HTTP associato nelle definizioni della pipeline. In questo modo, viene fornito un modo più affidabile e controllato per gestire le interazioni HTTP all'interno dei flussi di lavoro di elaborazione dei dati.

Amministrazione dello spazio dei nomi

Fai clic su Amministratore spazio dei nomi in Cloud Data Fusion Studio per e gestire le configurazioni per lo spazio dei nomi specifico. Per ogni spazio dei nomi, puoi definire i seguenti aspetti:

  • Profili di calcolo: i profili configurati in Amministrazione del nome di spazio sono profili di calcolo dell'utente. Solo le pipeline in questo spazio dei nomi possono utilizzare profili di calcolo. Per saperne di più, consulta Gestire i profili di calcolo.
  • Preferenze: le preferenze definite a livello di spazio dei nomi sono applicabili allo spazio dei nomi, alle applicazioni (che contengono le pipeline) e ai singoli programmi all'interno delle pipeline. Per ulteriori informazioni, consulta Gestire le macro preferenze e argomenti di runtime.
  • Connessioni: Cloud Data Fusion ti consente di riutilizzare le connessioni alle origini e ai sink nelle pipeline di dati. Puoi aggiungere connessioni nella pagina Amministrazione dell'area di nomi. Per scoprire di più, consulta la pagina Creare e gestire le connessioni.
  • Driver: alcuni plug-in in Cloud Data Fusion richiedono l'aggiunta di un driver JDBC al nome dell'area. Ad esempio, prima di poter eseguire una pipeline con Plug-in di origine batch MySQL, devi aggiungere il driver MySQL supportato al nello spazio dei nomi. Puoi caricare o rimuovere i driver JDBC in uno spazio dei nomi dal pagina Amministrazione spazio dei nomi o direttamente dall'hub. Per ulteriori informazioni, consulta Driver dei plug-in.
  • Gestione del controllo del codice sorgente: per gestire in modo efficiente il processo di sviluppo. di pipeline di cui è stato eseguito il deployment, la gestione del controllo del codice sorgente consente di connettere con il repository del sistema di controllo dei file sorgente. Per maggiori informazioni informazioni, consulta Gestire le pipeline utilizzando la gestione del controllo del codice sorgente.
  • Account di servizio: per controllare l'accesso alle risorse Google Cloud, degli spazi dei nomi in Cloud Data Fusion utilizzano Agente di servizio API Cloud Data Fusion per impostazione predefinita.

Per un migliore isolamento dei dati, puoi associare una Account di servizio Identity and Access Management (IAM) (noto come spazio dei nomi per spazio dei nomi) di servizio) con ogni spazio dei nomi. Il servizio IAM personalizzato che può essere diverso a seconda dello spazio dei nomi, ti consente di controllare accesso alle risorse Google Cloud tra gli spazi dei nomi per la pipeline le operazioni in fase di progettazione in Cloud Data Fusion, come l'anteprima della pipeline, Wrangler e convalida della pipeline. Per ulteriori informazioni, consulta Controllo dell'accesso con l'account di servizio dello spazio dei nomi.

Passaggi successivi