Aktivieren Sie die Datenherkunft in einem Google Cloud-Projekt, um mit dem automatischen Tracking von Herkunftsinformationen für unterstützte Systeme zu beginnen.
Rollen und Berechtigungen
Data Catalog verfolgt Herkunftsinformationen automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrolle, um die Herkunft Ihrer Daten-Assets zu erfassen und in der Google Cloud Console auf sie zuzugreifen. Es reichen Standard-Betrachterrollen, wie im Abschnitt Identity and Access Management beschrieben, aus. Weitere Informationen zum Gewähren von Rollen finden Sie unter Zugriff verwalten. Rollen lassen sich auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).
Data Lineage aktivieren
- Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl das Projekt mit den Ressourcen aus, für die Sie die Herkunft verfolgen möchten.
- Data Lineage API und Data Catalog API aktivieren
Herkunftsdiagramme in der Dataplex-UI ansehen
Das Visualisierungsdiagramm für die Herkunft zeigt die Beziehungen zwischen Ihren Projektressourcen und den Prozessen, mit denen sie erstellt wurden. Sie können Informationen zur Herkunft von Daten in Form einer Diagrammvisualisierung in der Google Cloud Console ansehen oder in Form von JSON-Daten aus der Data Lineage API abrufen.
Öffnen Sie die Dataplex-Suchseite und suchen Sie das Asset, für das Sie Herkunftsinformationen ansehen möchten.
Weitere Informationen finden Sie unter Nach Daten-Assets suchen.Wählen Sie auf der Seite mit den Eintragsdetails den Tab Lineage (Herkunft) aus.
Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.
Herkunftsdiagramme in der BigQuery-UI ansehen
Sie können das Herkunftsdiagramm direkt in der BigQuery-UI ansehen.
- Öffnen Sie in der Google Cloud Console die Seite BigQuery.
- Öffnen Sie die Tabelle, deren Datenherkunft angezeigt werden soll.
- Klicken Sie auf den Tab Lineage (Herkunft).
- Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.
Herkunftsdiagramme in der Vertex AI-UI ansehen
Systeme wie Vertex AI Pipelines generieren Herkunftsdaten für Vertex AI-Modelle und -Datasets. Sie können das Herkunftsdiagramm direkt in der Vertex AI-UI ansehen.
Herkunftsdiagramme für ein verwaltetes Dataset in Vertex AI ansehen
So rufen Sie das Herkunftsdiagramm für ein Dataset auf:
- Rufen Sie in der Google Cloud Console die Seite Datasets auf.
- Klicken Sie auf das Dataset, dessen Datenherkunft angezeigt werden soll.
- Klicken Sie auf den Tab Lineage (Herkunft).
- Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.
Herkunftsdiagramme für ein Modell in Vertex AI ansehen
So rufen Sie das Herkunftsdiagramm für ein Modell auf:
- Rufen Sie in der Google Cloud Console die Seite Model Registry auf.
- Klicken Sie auf das Modell, dessen Datenherkunft angezeigt werden soll.
- Klicken Sie auf den Tab Lineage (Herkunft).
- Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.
Nächste Schritte
Data Lineage für BigQuery-Tabellenkopier- und -Abfragejobs verfolgen
Weitere Informationen zum Informationsmodell zur Datenherkunft