Introduzione a Cloud Data Fusion: console

Questa pagina introduce Cloud Data Fusion: Console, noto anche come piano di controllo. È un insieme di API suite operativa e un'interfaccia della console Google Cloud ti consentono di gestire un'istanza Cloud Data Fusion. Ad esempio, utilizzando la console, puoi creare, eliminare, riavviare o aggiornare un'istanza.

Prima di iniziare

Cloud Data Fusion: panoramica della console

Le sezioni seguenti descrivono aspetti importanti della console.

Istanze

Un'istanza è un deployment unico di Cloud Data Fusion. Per iniziare a utilizzare Cloud Data Fusion, crei un'istanza nella console Google Cloud. Puoi creare più istanze Cloud Data Fusion in un unico progetto Google Cloud. Puoi specificare una regione Google Cloud per ogni in esecuzione in un'istanza Compute Engine. Ogni istanza è un servizio Cloud Data Fusion univoco e indipendente che contiene un set di servizi che gestiscono il ciclo di vita della pipeline gestione, orchestrazione, coordinamento e gestione dei metadati. Questi servizi utilizzando risorse a lunga esecuzione in un progetto tenant.

Quando crei l'istanza, valuta le seguenti opzioni.

Edizione

Puoi creare l'istanza in una delle seguenti versioni di Cloud Data Fusion: Developer, Basic o Enterprise. Scegli la versione in base ai seguenti criteri:

  • Costo
  • Limiti di contemporaneità per l'esecuzione della pipeline
  • Disponibilità del controllo dell'accesso basato sui ruoli (RBAC)

Le versioni sono pensate per i seguenti casi d'uso:

Versione Cloud Data Fusion Caso d'uso
Versione Developer Per sviluppo, test o integrazioni su piccola scala
Edizione Basic Per produzione con esigenze moderate
Versione Enterprise Per pipeline di dati mission critical su larga scala con RBAC

Istanza pubblica o privata

A seconda dei tuoi requisiti, decidi se hai bisogno di un'istanza pubblica o privata. Le principali differenze tra istanze private e pubbliche Cloud Data Fusion comprende connettività di rete e sicurezza:

Tipo di istanza Cloud Data Fusion Comportamento
Istanza pubblica
  • Connettività di rete: utilizza indirizzi IP pubblici per collegarti a internet.
  • Accesso ai dati: accede direttamente alle origini dati nella tramite la rete internet pubblica.
Per ulteriori informazioni, consulta Creare un'istanza pubblica.
Istanza privata
  • Connettività di rete: utilizza indirizzi IP privati in una rete Virtual Private Cloud (VPC).
  • Accesso ai dati: richiede connessioni preconfigurate a per accedere alle origini dati. Sono supportate le seguenti connessioni:
    • Origini dati on-premise connesse tramite VPN o Cloud Interconnect.
    • Altri servizi Google Cloud in esecuzione privatamente all'interno dello stesso in un VPC.

Autorizzazione e account di servizio

Cloud Data Fusion in genere dispone di due account di servizio:

Account di servizio in fase di progettazione
Questo account di servizio gestito da Google, chiamato servizio API Cloud Data Fusion agente, viene utilizzato nel progetto tenant di Cloud Data Fusion per accedere le risorse per i progetti dei clienti.
Account di servizio in fase di esecuzione
Questo è l'account di servizio Compute Engine predefinito Cloud Data Fusion crea per eseguire il deployment di job che accedono ad altre dell'accesso a specifiche risorse Google Cloud. Per impostazione predefinita, si collega VM cluster per abilitare Cloud Data Fusion per l'accesso a Dataproc durante l'esecuzione di una pipeline.

Per saperne di più, vedi Account di servizio in Cloud Data Fusion.

Logging e monitoraggio

Cloud Logging e Cloud Monitoring sono fondamentali per ottenere insight sull'integrità e delle tue pipeline di Cloud Data Fusion. Attiva Logging e Monitoraggio solo quando crei l'istanza Cloud Data Fusion.

L'abilitazione di Logging e Monitoring consente di visualizzare I log della pipeline di Cloud Data Fusion nella console Google Cloud nella Pagina Visualizzatore Logging.

Il monitoraggio fornisce dashboard integrate per Cloud Data Fusion. Puoi anche creare dashboard personalizzate per monitorare metriche specifiche.

Integrazione della derivazione con Dataplex

Cloud Data Fusion fornisce un'integrazione con Dataplex per la derivazione. Per saperne di più, vedi Visualizzare la derivazione in Dataplex.

Crittografia

Le chiavi di crittografia gestite dal cliente (CMEK) consentono la crittografia dei dati at-rest con un chiave che puoi controllare tramite Cloud Key Management Service. CMEK offre il controllo all'utente sui dati scritti nelle risorse interne di Google Cloud nei progetti tenant e i dati scritti dalle pipeline di Cloud Data Fusion. Per ulteriori informazioni, vedi Crittografia dei dati gestita dal cliente.

Gestire le autorizzazioni con il controllo dell'accesso basato sui ruoli (RBAC)

Cloud Data Fusion consente il controllo con Identity and Access Management (IAM).

Per autorizzazioni granulari per le azioni eseguite in Cloud Data Fusion: Studio operazioni, usa RBAC. Per ulteriori informazioni, consulta Panoramica di RBAC.

Upgrade delle versioni

Cloud Data Fusion ha le versioni. Puoi eseguire l'upgrade di un'istanza a una versione successiva nella console Cloud Data Fusion. Per ulteriori informazioni, consulta Controllo delle versioni in Cloud Data Fusion.

Passaggi successivi