Datenherkunft mit Google Cloud-Systemen verwenden

Die Datenabstammung zeigt die Beziehungen zwischen den Ressourcen Ihres Projekts und den Prozessen, die sie erstellt haben. Sie können Informationen zur Datenabfolge in Form einer Grafikvisualisierung oder einer Listenansicht in der Google Cloud Console aufrufen oder sie in Form von JSON-Daten über die Data Lineage API abrufen.

Die Abfolge wird projektübergreifend erfasst. Wenn Sie eine Abfolge aufrufen, die aus mehreren Projekten generiert wurde, können Sie die aggregierten Abfolgeinformationen in jedem der entsprechenden Projekte aufrufen.

Rollen und Berechtigungen

Wenn Sie Informationen zur Datenherkunft aufrufen möchten, bitten Sie Ihren Administrator, Ihnen die Rolle „Betrachter“ zuzuweisen, wie unter Vordefinierte Rollen für die Datenherkunft beschrieben. Sie benötigen Zugriff sowohl auf das Projekt, in dem Sie die Abfolge aufrufen, als auch auf die Projekte, in denen die Abfolge aufgezeichnet wird.

Data Catalog erfasst Informationen zur Herkunft automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrollen, um die Herkunft Ihrer Daten-Assets zu erfassen.

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten. Sie können eine Rolle auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).

Datenabfolge aktivieren

Aktivieren Sie die Data Lineage, um automatisch Informationen zur Datenherkunft für unterstützte Systeme zu erfassen. Sie müssen die Data Lineage API sowohl in dem Projekt aktivieren, in dem Sie die Datenabfolge aufrufen, als auch in den Projekten, in denen die Datenabfolge aufgezeichnet wird. Weitere Informationen finden Sie unter Projekttypen.

  1. So erfassen Sie Informationen zur Herkunft:

    1. Wählen Sie in der Google Cloud Console auf der Seite Projektauswahl das Projekt aus, in dem Sie die Herkunft aufzeichnen möchten.

      Zur Projektauswahl

    2. Aktivieren Sie die Data Lineage API.

      Data Lineage API aktivieren

    3. Wiederholen Sie die vorherigen Schritte für jedes Projekt, für das Sie die Herkunft aufzeichnen möchten.
  2. Aktivieren Sie in dem Projekt, in dem Sie die Datenabfolge aufrufen möchten, die Data Lineage API und die Data Catalog API.

    APIs aktivieren

Lineage in der Dataplex-Benutzeroberfläche ansehen

Sie können sich Informationen zur Datenherkunft in der Dataplex-Benutzeroberfläche in Form eines Diagramms oder einer Liste ansehen.

Lineage-Diagramme stellen Informationen dar, die von der Data Lineage API für einen bestimmten Eintrag erfasst wurden.

Ein Beispieldiagramm zeigt Daten aus zwei Tabellen, die transformiert und dann zusammengeführt werden.
Abbildung 1. Beispiel für ein Diagramm zur Visualisierung der Datenabfolge in der Dataplex-Benutzeroberfläche

In der Listenansicht für die Herkunft (Vorabversion) werden detaillierte Herkunftsinformationen für Entitäten in einer einzigen Tabelle angezeigt, die auch Herkunftsinformationen für Entitäten mit vielen Verbindungen enthält.

So rufen Sie die Abfolge auf:

  1. Öffnen Sie die Dataplex-Suchseite und suchen Sie nach dem Asset, für das Sie Informationen zur Herkunft aufrufen möchten.

    Dataplex-Suche aufrufen

    Weitere Informationen finden Sie unter In Datenassets suchen.

  2. Wählen Sie auf der Seite mit den Details zum Eintrag den Tab Abstammung aus.

  3. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  4. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  5. Wenn Sie die Abfolge in der Listenansicht statt in der Graphansicht aufrufen möchten, klicken Sie auf Liste.

Herkunft in der BigQuery-Benutzeroberfläche ansehen

Sie können Informationen zur Datenabfolge in der BigQuery-Benutzeroberfläche in Form eines Diagramms oder einer Liste aufrufen (Vorabversion).

So rufen Sie die Abfolge auf:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    Zur Seite „BigQuery“

  2. Öffnen Sie die Tabelle, für die Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  6. Wenn Sie die Abfolge in der Listenansicht statt in der Graphansicht aufrufen möchten, klicken Sie auf Liste.

Herkunft in der Vertex AI-Benutzeroberfläche ansehen

Systeme wie Vertex AI Pipelines generieren Abstammungsdaten für Vertex AI-Modelle und ‑Datasets. Sie können sich Informationen zur Datenabfolge in der Vertex AI-Benutzeroberfläche in Form eines Diagramms oder einer Liste ansehen (Vorabversion).

Herkunft für ein verwaltetes Dataset in Vertex AI aufrufen

So rufen Sie die Herkunftsabfolge für ein Dataset auf:

  1. Rufen Sie in der Google Cloud Console die Seite Datasets auf.

    Seite „Datasets“ öffnen

  2. Klicken Sie auf das Dataset, für das Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  6. Wenn Sie die Abfolge in der Listenansicht statt in der Graphansicht sehen möchten, klicken Sie auf Liste.

Herkunft eines Modells in Vertex AI ansehen

So rufen Sie die Abfolge für ein Modell auf:

  1. Rufen Sie in der Google Cloud Console die Seite Model Registry auf.

    Seite „Model Registry“ öffnen

  2. Klicken Sie auf das Modell, für das Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  6. Wenn Sie die Abfolge in der Listenansicht statt in der Graphansicht sehen möchten, klicken Sie auf Liste.

Nächste Schritte