Data Lineage mit Google Cloud-Systemen verwenden

Aktivieren Sie die Datenherkunft in einem Google Cloud-Projekt, um mit dem automatischen Tracking von Herkunftsinformationen für unterstützte Systeme zu beginnen.

Rollen und Berechtigungen

Data Catalog verfolgt Herkunftsinformationen automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrolle, um die Herkunft Ihrer Daten-Assets zu erfassen und in der Google Cloud Console auf sie zuzugreifen. Es reichen Standard-Betrachterrollen, wie im Abschnitt Identity and Access Management beschrieben, aus. Weitere Informationen zum Gewähren von Rollen finden Sie unter Zugriff verwalten. Rollen lassen sich auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).

Data Lineage aktivieren

  1. Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl das Projekt mit den Ressourcen aus, für die Sie die Herkunft verfolgen möchten.

    Zur Projektauswahl

  2. Data Lineage API und Data Catalog API aktivieren

    APIs aktivieren

Herkunftsdiagramme in der Dataplex-UI ansehen

Das Visualisierungsdiagramm für die Herkunft zeigt die Beziehungen zwischen Ihren Projektressourcen und den Prozessen, mit denen sie erstellt wurden. Sie können Informationen zur Herkunft von Daten in Form einer Diagrammvisualisierung in der Google Cloud Console ansehen oder in Form von JSON-Daten aus der Data Lineage API abrufen.

  1. Öffnen Sie die Dataplex-Suchseite und suchen Sie das Asset, für das Sie Herkunftsinformationen ansehen möchten.

    Dataplex-Suchseite öffnen

    Weitere Informationen finden Sie unter Nach Daten-Assets suchen.

  2. Wählen Sie auf der Seite mit den Eintragsdetails den Tab Lineage (Herkunft) aus.

Ein Beispieldiagramm zeigt Daten aus zwei Tabellen, die transformiert und dann zusammengeführt werden.
Abbildung 1. Beispiel für ein Lineage-Visualisierungsdiagramm in der Dataplex-UI.

Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.

Herkunftsdiagramme in der BigQuery-UI ansehen

Sie können das Herkunftsdiagramm direkt in der BigQuery-UI ansehen.

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    Zur Seite „BigQuery“

  2. Öffnen Sie die Tabelle, deren Datenherkunft angezeigt werden soll.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.

Herkunftsdiagramme in der Vertex AI-UI ansehen

Systeme wie Vertex AI Pipelines generieren Herkunftsdaten für Vertex AI-Modelle und -Datasets. Sie können das Herkunftsdiagramm direkt in der Vertex AI-UI ansehen.

Herkunftsdiagramme für ein verwaltetes Dataset in Vertex AI ansehen

So rufen Sie das Herkunftsdiagramm für ein Dataset auf:

  1. Rufen Sie in der Google Cloud Console die Seite Datasets auf.

    Seite "Datasets" öffnen

  2. Klicken Sie auf das Dataset, dessen Datenherkunft angezeigt werden soll.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.

Herkunftsdiagramme für ein Modell in Vertex AI ansehen

So rufen Sie das Herkunftsdiagramm für ein Modell auf:

  1. Rufen Sie in der Google Cloud Console die Seite Model Registry auf.

    Seite "Modell-Registry" öffnen

  2. Klicken Sie auf das Modell, dessen Datenherkunft angezeigt werden soll.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Klicken Sie auf die Schaltflächen „Prozess“ oder „Datenquelle“, um den Detailbereich aufzurufen.

Nächste Schritte