Einführung in Cloud Data Fusion: Console

Auf dieser Seite wird die Cloud Data Fusion-Konsole vorgestellt, die auch als Steuerungsebene. Es besteht aus einer Reihe von API- Operations und eine Google Cloud Console-Oberfläche, können Sie eine Cloud Data Fusion-Instanz verwalten. Wenn Sie beispielsweise können Sie eine Instanz erstellen, löschen, neu starten oder aktualisieren.

Hinweise

Cloud Data Fusion: Console-Übersicht

In den folgenden Abschnitten werden wichtige Aspekte der Konsole beschrieben.

Instanzen

Eine Instanz ist eine einzigartige Bereitstellung von Cloud Data Fusion. So verwenden Sie Cloud Data Fusion erstellen Sie eine Instanz in der Google Cloud Console. Sie können mehrere Cloud Data Fusion-Instanzen in einem einzigen Google Cloud-Projekt Sie können für jede eine Google Cloud-Region Instanz. Jede Instanz ist eine einzigartige, unabhängige Cloud Data Fusion-Instanz Bereitstellung mit einer Reihe von Diensten zur Verwaltung des Pipelinelebenszyklus Orchestrierung, Koordination und Metadatenmanagement. Diese Dienste mit lang andauernden Ressourcen in einem Mandantenprojekt

Berücksichtigen Sie beim Erstellen der Instanz die folgenden Optionen.

Version

Sie erstellen die Instanz in einer der folgenden Cloud Data Fusion-Versionen: Entwickler, Basic oder Enterprise. Wählen Sie die Version anhand der folgenden Kriterien aus:

  • Kosten
  • Gleichzeitigkeitslimits für die Pipelineausführung
  • Verfügbarkeit der rollenbasierten Zugriffssteuerung (Role-Based Access Control, RBAC)

Die Versionen sind für folgende Anwendungsfälle vorgesehen:

Cloud Data Fusion-Version Anwendungsfall
Entwicklerversion Für Entwicklung, Tests oder kleine Integrationen
Basic Edition Für Produktion mit moderaten Anforderungen
Enterprise-Version Für umfangreiche, geschäftskritische Datenpipelines mit RBAC

Öffentliche oder private Instanz

Entscheiden Sie je nach Bedarf, ob Sie eine öffentliche oder eine private Instanz. Die Hauptunterschiede zwischen privaten und öffentlichen Instanzen in Cloud Data Fusion umfasst Netzwerkkonnektivität und -sicherheit:

Cloud Data Fusion-Instanztyp Verhalten
Öffentliche Instanz
  • Netzwerkverbindung: nutzt öffentliche IP-Adressen für mit dem Internet verbinden.
  • Datenzugriff: greift direkt auf Datenquellen auf der öffentlich zugänglichen Internet.
Weitere Informationen finden Sie unter Öffentliche Instanz erstellen.
Private Instanz
  • Netzwerkverbindung: Verwendet private IP-Adressen in einem VPC-Netzwerk (Virtual Private Cloud)
  • Datenzugriff: erfordert vorkonfigurierte Verbindungen zu auf Datenquellen zugreifen können. Die folgenden Verbindungen werden unterstützt: <ph type="x-smartling-placeholder">
      </ph>
    • Lokale Datenquellen, die über VPN oder Cloud Interconnect
    • Andere Google Cloud-Dienste, die privat innerhalb desselben VPC

Autorisierung und Dienstkonto

Cloud Data Fusion hat in der Regel zwei Dienstkonten:

Dienstkonto während der Entwicklung
Dieses von Google verwaltete Dienstkonto, das als Cloud Data Fusion API-Dienst bezeichnet wird Agent, wird im Mandantenprojekt von Cloud Data Fusion für den Zugriff auf Ressourcen des Kundenprojekts.
Dienstkonto für die Ausführungszeit
Dies ist das Compute Engine-Standarddienstkonto, das Cloud Data Fusion erstellt, um Jobs bereitzustellen, die auf andere Google Cloud-Ressourcen Standardmäßig wird es an Dataproc angehängt. Cluster-VM, damit Cloud Data Fusion auf Dataproc zugreifen kann während einer Pipelineausführung.

Weitere Informationen finden Sie unter Dienstkonten in Cloud Data Fusion.

Logging und Monitoring

Cloud Logging und Cloud Monitoring sind entscheidend, um Informationen zum Status und die Leistung Ihrer Cloud Data Fusion-Pipelines. Sie aktivieren Logging und Monitoring nur, wenn Sie die Cloud Data Fusion-Instanz erstellen.

Wenn Sie Logging und Monitoring aktivieren, können Sie Cloud Data Fusion-Pipelinelogs in der Google Cloud Console auf der Logging-Viewer:

Monitoring bietet integrierte Dashboards für Cloud Data Fusion. Sie können auch benutzerdefinierte Dashboards erstellen, spezifischer Metriken.

Lineage-Einbindung in Dataplex

Cloud Data Fusion bietet eine Einbindung in Dataplex für Herkunft. Weitere Informationen finden Sie unter Lineage in Dataplex ansehen.

Verschlüsselung

Vom Kunden verwaltete Verschlüsselungsschlüssel (Customer-Managed Encryption Keys, CMEK) ermöglichen die Verschlüsselung ruhender Daten mit einem Schlüssel, den Sie über den Cloud Key Management Service steuern können. CMEK bietet Nutzerkontrolle über die Daten, die in interne Google Cloud-Ressourcen in Mandantenprojekten geschrieben wurden und von Cloud Data Fusion-Pipelines geschriebene Daten. Weitere Informationen finden Sie unter Vom Kunden verwaltete Datenverschlüsselung

Berechtigungen mit der rollenbasierten Zugriffssteuerung (Role-Based Access Control, RBAC) verwalten

Cloud Data Fusion ermöglicht die Steuerung mit Identity and Access Management (IAM).

Für detaillierte Berechtigungen für Aktionen, die in Cloud Data Fusion ausgeführt werden: Studio mit RBAC. Weitere Informationen finden Sie in der RBAC-Übersicht

Versionsupgrades

Für Cloud Data Fusion gibt es Versionen. Sie können eine Instanz auf eine spätere Instanz upgraden Version in der Cloud Data Fusion-Konsole. Weitere Informationen finden Sie unter Versionsverwaltung in Cloud Data Fusion

Nächste Schritte