Questa pagina introduce Cloud Data Fusion: Console, nota anche come piano di controllo. Si tratta di un insieme di operazioni dell'API e di un'interfaccia della console Google Cloud che ti consente di gestire un'istanza Cloud Data Fusion. Ad esempio, utilizzando la console puoi creare, eliminare, riavviare o aggiornare un'istanza.
Prima di iniziare
- Attiva l'API Cloud Data Fusion.
- Scopri i costi delle versioni di Cloud Data Fusion.
- Scopri di più sul controllo dell'accesso e sugli account di servizio in Cloud Data Fusion.
Cloud Data Fusion: panoramica della console
Le sezioni seguenti descrivono aspetti importanti della console.
Istanze
Un'istanza è un deployment unico di Cloud Data Fusion. Per iniziare a utilizzare Cloud Data Fusion, crea un'istanza nella console Google Cloud. Puoi creare più istanze Cloud Data Fusion in un singolo Google Cloud progetto. Puoi specificare una Google Cloud regione per ogni istanza. Ogni istanza è un deployment Cloud Data Fusion indipendente e univoco, che contiene un insieme di servizi che gestiscono la gestione del ciclo di vita della pipeline, l'orchestrazione, la coordinazione e la gestione dei metadati. Questi servizi vengono eseguiti utilizzando risorse a lungo termine in un progetto tenant.
Quando crei l'istanza, valuta le seguenti opzioni.
Edizione
Crea l'istanza in una delle seguenti versioni di Cloud Data Fusion: Developer, Basic o Enterprise. Scegli la versione in base ai seguenti criteri:
- Costo
- Limiti di concorrenza per l'esecuzione della pipeline
- Disponibilità del controllo degli accessi basato sui ruoli (RBAC)
Le versioni sono destinate ai seguenti casi d'uso:
Versione di Cloud Data Fusion | Caso d'uso |
---|---|
Edizione Developer | Per lo sviluppo, i test o le integrazioni su piccola scala |
Edizione Basic | Per la produzione con esigenze moderate |
Versione Enterprise | Per pipeline di dati mission critical su larga scala con RBAC |
Istanza pubblica o privata
A seconda dei tuoi requisiti, decidi se hai bisogno di un'istanza pubblica o privata. Le differenze principali tra le istanze private e pubbliche in Cloud Data Fusion sono la connettività di rete e la sicurezza:
Tipo di istanza Cloud Data Fusion | Comportamento |
---|---|
Istanza pubblica |
|
Istanza privata |
|
Autorizzazione e account di servizio
In genere Cloud Data Fusion ha due account di servizio:
- Service account di design
- Questo account di servizio gestito da Google, chiamato agente di servizio API Cloud Data Fusion, viene utilizzato nel progetto tenant di Cloud Data Fusion per accedere alle risorse del progetto del cliente.
- Service account di esecuzione
- Si tratta dell'account di servizio Compute Engine predefinito creato da Cloud Data Fusion per eseguire il deployment di job che accedono ad altre risorseGoogle Cloud . Per impostazione predefinita, si connette a una VM del cluster Dataproc per consentire a Cloud Data Fusion di accedere alle risorse Dataproc durante l'esecuzione di una pipeline.
Per saperne di più, consulta Account di servizio in Cloud Data Fusion.
Logging e monitoraggio
Cloud Logging e Cloud Monitoring sono fondamentali per ottenere informazioni sullo stato e sulle prestazioni delle pipeline di Cloud Data Fusion. Attiva Logging e Monitoraggio solo quando crei l'istanza Cloud Data Fusion.
L'attivazione di Logging e monitoraggio ti consente di visualizzare i log della pipeline Cloud Data Fusion nella console Google Cloud nella pagina Visualizzatore dei log.
Il monitoraggio fornisce dashboard integrate per Cloud Data Fusion. Puoi anche creare dashboard personalizzate per monitorare metriche specifiche.
Integrazione della derivazione con Dataplex
Cloud Data Fusion fornisce un'integrazione con Dataplex per la gestione della lineage. Per saperne di più, consulta Visualizzare la derivazione in Dataplex.
Crittografia
Le chiavi di crittografia gestite dal cliente (CMEK) consentono la crittografia dei dati at-rest con una chiave che puoi controllare tramite Cloud Key Management Service. Le CMEK offrono all'utente il controllo sui dati scritti nelle Google Cloud risorse interne dei progetti tenant e sui dati scritti dalle pipeline di Cloud Data Fusion. Per ulteriori informazioni, consulta Crittografia dei dati gestita dal cliente.
Gestire le autorizzazioni con il controllo degli accessi basato sui ruoli (RBAC)
Cloud Data Fusion ti consente di controllare con Identity and Access Management (IAM).
Per le autorizzazioni granulari per le azioni eseguite in Cloud Data Fusion: operazioni in Studio, utilizza RBAC. Per ulteriori informazioni, consulta la panoramica del RBAC.
Upgrade delle versioni
Cloud Data Fusion ha versioni. Puoi eseguire l'upgrade di un'istanza a una versione successiva nella console Cloud Data Fusion. Per ulteriori informazioni, consulta Controllo delle versioni in Cloud Data Fusion.
Passaggi successivi
- Scopri di più su Cloud Data Fusion: Studio.