Data Lineage mit Google Cloud-Systemen verwenden

Aktivieren Sie die Data Lineage in einem Google Cloud-Projekt, um Lineage-Informationen für unterstützte Systeme automatisch zu verfolgen.

Rollen und Berechtigungen

Data Catalog verfolgt Herkunftsinformationen automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrolle, um die Herkunft für Ihre Daten-Assets zu erfassen und in der Google Cloud Console darauf zuzugreifen. Die im Abschnitt Identity and Access Management beschriebenen Standard-Betrachterrollen sind ausreichend. Weitere Informationen zum Gewähren von Rollen finden Sie unter Zugriff verwalten. Sie können eine Rolle auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).

Data Lineage aktivieren

  1. Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl das Projekt aus, das die Ressourcen enthält, für die Sie die Herkunft verfolgen möchten.

    Zur Projektauswahl

  2. Aktivieren Sie die Data Lineage API und die Data Catalog API.

    APIs aktivieren

Lineage-Diagramme in der Dataplex-UI ansehen

Das Diagramm zur Visualisierung der Herkunft zeigt die Beziehungen zwischen Ihren Projektressourcen und den Prozessen, von denen sie erstellt wurden. Sie können sich Informationen zur Data Lineage in der Google Cloud Console in Form eines Diagramms ansehen oder sie in Form von JSON-Daten aus der Data Lineage API abrufen.

  1. Öffnen Sie die Dataplex-Suchseite und suchen Sie das Asset, für das Sie die Herkunftsinformationen ansehen möchten.

    Zur Dataplex-Suchseite

    Weitere Informationen finden Sie unter So suchen Sie nach Daten-Assets.

  2. Wählen Sie auf der Seite mit den Eintragsdetails den Tab Lineage aus.

Ein Beispieldiagramm zeigt, wie Daten aus zwei Tabellen transformiert und dann zusammengeführt werden.
Abbildung 1. Beispiel für ein Lineage-Visualisierungsdiagramm in der Dataplex-UI.

Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich einzublenden.

Lineage-Diagramme in der BigQuery-UI ansehen

Sie können das Lineage-Diagramm direkt in der BigQuery-UI aufrufen.

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    Zur Seite „BigQuery“

  2. Öffnen Sie die Tabelle, deren Datenherkunft angezeigt werden soll.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich einzublenden.

Lineage-Diagramme in der Vertex AI-UI ansehen

Systeme wie Vertex AI Pipelines generieren Lineage-Daten für Vertex AI-Modelle und -Datasets. Sie können das Lineage-Diagramm direkt in der Betex AI-UI aufrufen.

Herkunftsdiagramme für ein verwaltetes Dataset in Vertex AI ansehen

So rufen Sie das Herkunftsdiagramm für ein Dataset auf:

  1. Rufen Sie in der Google Cloud Console die Seite Datasets auf.

    Zur Seite "Datasets"

  2. Klicken Sie auf das Dataset, für das Sie die Datenherkunft sehen möchten.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich einzublenden.

Herkunftsdiagramme für ein Modell in Vertex AI ansehen

So rufen Sie das Lineage-Diagramm für ein Modell auf:

  1. Rufen Sie in der Google Cloud Console die Seite Model Registry auf.

    Seite „Modellregistrierung“ öffnen

  2. Klicken Sie auf das Modell, für das Sie die Datenherkunft sehen möchten.
  3. Klicken Sie auf den Tab Lineage (Herkunft).
  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich einzublenden.

Nächste Schritte