Auf dieser Seite wird beschrieben, wie Sie die von Ihren Cloud Data Fusion-Pipelines generierte Datenherkunft mit anderen Datenbewegungen zu Erkennungs- und Governance-Zwecken ansehen. Sie können sich die Herkunftsdiagramme für unterstützte Datenquellen auf der Dataplex-Seite in der Console ansehen oder mit der Data Lineage API vollständige Data Lineage-Einträge abrufen.
Plug-ins, die die Datenherkunft in Dataplex unterstützen
Cloud Data Fusion und Dataplex unterstützen die Herkunft auf Asset-Ebene für die folgenden Plug-ins:
- Amazon S3
- BigQuery
- BigQuery-Tabelle für mehrere Tabellen (Version 6.9.1 und höher)
- Cloud Spanner
- Cloud Storage
- Cloud SQL for MySQL
- Cloud SQL for PostgreSQL
- Dataplex
- FTP
- Allgemeine Datenbank
- HTTP
- MSSQL/SQL Server
- Quelle für mehrere Datenbanktabellen (Version 6.9.1 und höher)
- MySQL
- Oracle
- PostgreSQL
- SAP-OData
- SAP ODP
- SAP-Tabelle
Weitere Informationen finden Sie unter Cloud Data Fusion-Plug-ins.
Hinweis
So aktivieren Sie die Anzeige von Cloud Data Fusion-Herkunftsdiagrammen auf der Dataplex-Seite in der Console:
Erstellen Sie eine Datenpipeline, die nur die unterstützten Plug-ins verwendet.
Aktivieren Sie die Data Lineage API in dem Projekt, das Ihre Cloud Data Fusion-Instanz enthält.
Gewähren Sie dem von Cloud Data Fusion verwalteten Dienstkonto die Rolle „Data Lineage Events Producer“ (
roles/datalineage.producer
). Weitere Informationen finden Sie in den vordefinierten Herkunftsrollen von Data Catalog.Instanzen ohne RBAC
Wenn die rollenbasierte Zugriffssteuerung (RBAC) für die Instanz nicht aktiviert ist, weisen Sie dem Cloud Data Fusion API-Dienst-Agent die Rolle „Data Lineage Events Producer“ (
roles/datalineage.producer
) zu.So weisen Sie die erforderliche Rolle zu:
Öffnen Sie in der Google Cloud Console die Seite IAM.
Klicken Sie auf das Kästchen Von Google bereitgestellte Rollenzuweisungen einschließen.
Wählen Sie das Dienstkonto des Cloud Data Fusion API-Dienst-Agents als Hauptkonto aus und klicken Sie auf Bearbeiten.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie die Rolle Data Lineage Ereignisse Producer aus.
Klicken Sie auf Speichern.
Instanzen mit RBAC
Bei Instanzen, für die die rollenbasierte Zugriffssteuerung (RBAC) aktiviert ist, hat das Dienstkonto, dem Sie die Rolle zuweisen, das folgende Format:
datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com
. Es wird nicht in der Liste der Hauptkonten auf der IAM-Seite angezeigt.So weisen Sie die erforderliche Rolle zu:
Öffnen Sie in der Google Cloud Console die Seite IAM.
Klicken Sie auf Zugriff erlauben.
Geben Sie in das Feld Neue Hauptkonten das Dienstkonto für den Cloud Data Fusion API-Dienst ein:
datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com
.Wählen Sie die Rolle Data Lineage Events Producer aus.
Klicken Sie auf Speichern.
Wenn Herkunft verfügbar ist
Für die Anzeige der Herkunft in Dataplex gelten folgende Einschränkungen:
Die Herkunft in Dataplex ist nur sichtbar, wenn eine BigQuery-Entität mit den unterstützten Plug-ins verbunden ist. Weitere Informationen zur Verfügbarkeit von Data Lineage-Diagrammen finden Sie unter Data Lineage.
Die Data Lineage API unterstützt keine vom Kunden verwalteten Verschlüsselungsschlüssel (CMEKs).
Data Lineage-Diagramme ansehen
So rufen Sie die Herkunftsdiagramme für Entitäten in allen Google Cloud-Diensten auf:
Rufen Sie Ihre Instanz in Cloud Data Fusion auf und führen Sie eine Datenpipeline aus, die unterstützte Plug-ins verwendet.
Rufen Sie die Herkunftsdiagramme auf der Dataplex-Seite in der Console auf und suchen Sie das Asset, für das Sie die Herkunftsinformationen aufrufen möchten.