Herkunft in Dataplex ansehen

Auf dieser Seite wird beschrieben, wie Sie die von Ihren Cloud Data Fusion-Pipelines generierte Datenherkunft mit anderen Datenbewegungen zu Erkennungs- und Governance-Zwecken ansehen. Sie können sich die Herkunftsdiagramme für unterstützte Datenquellen auf der Dataplex-Seite in der Console ansehen oder mit der Data Lineage API vollständige Data Lineage-Einträge abrufen.

Plug-ins, die die Datenherkunft in Dataplex unterstützen

Cloud Data Fusion und Dataplex unterstützen die Herkunft auf Asset-Ebene für die folgenden Plug-ins:

  • Amazon S3
  • BigQuery
  • BigQuery-Tabelle für mehrere Tabellen (Version 6.9.1 und höher)
  • Cloud Spanner
  • Cloud Storage
  • Cloud SQL for MySQL
  • Cloud SQL for PostgreSQL
  • Dataplex
  • FTP
  • Allgemeine Datenbank
  • HTTP
  • MSSQL/SQL Server
  • Quelle für mehrere Datenbanktabellen (Version 6.9.1 und höher)
  • MySQL
  • Oracle
  • PostgreSQL
  • SAP-OData
  • SAP ODP
  • SAP-Tabelle

Weitere Informationen finden Sie unter Cloud Data Fusion-Plug-ins.

Hinweis

So aktivieren Sie die Anzeige von Cloud Data Fusion-Herkunftsdiagrammen auf der Dataplex-Seite in der Console:

  1. Erstellen Sie eine Datenpipeline, die nur die unterstützten Plug-ins verwendet.

  2. Aktivieren Sie die Data Lineage API in dem Projekt, das Ihre Cloud Data Fusion-Instanz enthält.

  3. Gewähren Sie dem von Cloud Data Fusion verwalteten Dienstkonto die Rolle „Data Lineage Events Producer“ (roles/datalineage.producer). Weitere Informationen finden Sie in den vordefinierten Herkunftsrollen von Data Catalog.

    Instanzen ohne RBAC

    Wenn die rollenbasierte Zugriffssteuerung (RBAC) für die Instanz nicht aktiviert ist, weisen Sie dem Cloud Data Fusion API-Dienst-Agent die Rolle „Data Lineage Events Producer“ (roles/datalineage.producer) zu.

    So weisen Sie die erforderliche Rolle zu:

    1. Öffnen Sie in der Google Cloud Console die Seite IAM.

      IAM aufrufen

    2. Klicken Sie auf das Kästchen Von Google bereitgestellte Rollenzuweisungen einschließen.

    3. Wählen Sie das Dienstkonto des Cloud Data Fusion API-Dienst-Agents als Hauptkonto aus und klicken Sie auf Bearbeiten.

    4. Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie die Rolle Data Lineage Ereignisse Producer aus.

    5. Klicken Sie auf Speichern.

    Instanzen mit RBAC

    Bei Instanzen, für die die rollenbasierte Zugriffssteuerung (RBAC) aktiviert ist, hat das Dienstkonto, dem Sie die Rolle zuweisen, das folgende Format: datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com. Es wird nicht in der Liste der Hauptkonten auf der IAM-Seite angezeigt.

    So weisen Sie die erforderliche Rolle zu:

    1. Öffnen Sie in der Google Cloud Console die Seite IAM.

      IAM aufrufen

    2. Klicken Sie auf Zugriff erlauben.

    3. Geben Sie in das Feld Neue Hauptkonten das Dienstkonto für den Cloud Data Fusion API-Dienst ein: datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com.

    4. Wählen Sie die Rolle Data Lineage Events Producer aus.

    5. Klicken Sie auf Speichern.

Wenn Herkunft verfügbar ist

Für die Anzeige der Herkunft in Dataplex gelten folgende Einschränkungen:

Data Lineage-Diagramme ansehen

So rufen Sie die Herkunftsdiagramme für Entitäten in allen Google Cloud-Diensten auf:

  1. Rufen Sie Ihre Instanz in Cloud Data Fusion auf und führen Sie eine Datenpipeline aus, die unterstützte Plug-ins verwendet.

  2. Rufen Sie die Herkunftsdiagramme auf der Dataplex-Seite in der Console auf und suchen Sie das Asset, für das Sie die Herkunftsinformationen aufrufen möchten.

Nächste Schritte