Datenherkunft mit Google Cloud-Systemen verwenden

Die Datenabstammung zeigt die Beziehungen zwischen den Ressourcen Ihres Projekts und den Prozessen, die sie erstellt haben. Sie können Informationen zur Datenabfolge in Form einer Grafikvisualisierung oder einer Listenansicht in der Google Cloud Console aufrufen oder sie in Form von JSON-Daten über die Data Lineage API abrufen.

Die Abfolge wird projektübergreifend erfasst. Wenn Sie eine Abfolge aufrufen, die aus mehreren Projekten generiert wurde, können Sie die aggregierten Abfolgeinformationen in jedem der entsprechenden Projekte aufrufen.

Rollen und Berechtigungen

Wenn Sie Informationen zur Datenherkunft aufrufen möchten, bitten Sie Ihren Administrator, Ihnen die Rollen „Betrachter“ zuzuweisen, wie unter Vordefinierte Rollen für die Datenherkunft beschrieben. Sie benötigen Zugriff sowohl auf das Projekt, in dem Sie die Abfolge aufrufen, als auch auf die Projekte, in denen die Abfolge aufgezeichnet wird.

Data Catalog erfasst Informationen zur Datenherkunft automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrolle, um die Herkunft für Ihre Daten-Assets.

Weitere Informationen zum Gewähren von Rollen Weitere Informationen finden Sie unter Zugriff verwalten. Sie können eine Rolle auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).

Data Lineage aktivieren

Aktivieren Sie die Datenherkunft, um die Herkunft automatisch zu verfolgen Informationen zu unterstützten Systemen. Sie müssen die Data Lineage API sowohl in dem Projekt aktivieren, in dem Sie die Datei ansehen, Lineage und die Projekte, in denen Lineage aufgezeichnet wird. Weitere Informationen finden Sie unter Projekttypen:

  1. So erfassen Sie Informationen zur Herkunft:

    1. Wählen Sie in der Google Cloud Console auf der Seite Projektauswahl das Projekt aus, in dem Sie die Herkunft aufzeichnen möchten.

      Zur Projektauswahl

    2. Aktivieren Sie die Data Lineage API.

      Data Lineage API aktivieren

    3. Wiederholen Sie die vorherigen Schritte für jedes Projekt, in dem Sie Herkunft aufzeichnen.
  2. Aktivieren Sie in dem Projekt, in dem Sie die Datenabfolge aufrufen möchten, die Data Lineage API und die Data Catalog API.

    APIs aktivieren

Lineage in der Dataplex-UI ansehen

Sie können sich Informationen zur Datenherkunft in der Dataplex-Benutzeroberfläche in Form eines Diagramms oder einer Liste ansehen.

Lineage-Diagramme stellen Informationen dar, die von der Data Lineage API für einen bestimmten Eintrag erfasst wurden.

Ein Beispieldiagramm zeigt, wie Daten aus zwei Tabellen transformiert und dann zusammengeführt werden.
Abbildung 1. Beispiel für ein Diagramm zur Visualisierung der Datenabfolge in der Dataplex-Benutzeroberfläche

Lineage-Listenansicht (Vorschau) wird angezeigt um detaillierte Lineage-Informationen für Entitäten in einem Tabelle, die die Herkunftsinformationen für Entitäten mit vielen Verbindungen enthält.

So rufen Sie die Abfolge auf:

  1. Öffnen Sie die Dataplex-Suchseite und suchen Sie nach dem Asset, für das Sie Informationen zur Herkunft aufrufen möchten.

    Dataplex-Suche aufrufen

    Weitere Informationen finden Sie unter So suchen Sie nach Daten-Assets.

  2. Wählen Sie auf der Seite mit den Details zum Eintrag den Tab Abstammung aus.

  3. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  4. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf  Maximieren.

  5. Klicken Sie auf Liste, um die Herkunft in der Listenansicht und nicht in der Grafikansicht anzeigen zu lassen.

Herkunft in der BigQuery-Benutzeroberfläche ansehen

Data-Lineage-Informationen können in der BigQuery-Benutzeroberfläche in der Form ein Diagramm oder eine Liste (Vorschau).

So rufen Sie die Herkunft auf:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    Zur Seite „BigQuery“

  2. Öffnen Sie die Tabelle, für die Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf  Maximieren.

  6. Klicken Sie auf Liste, um die Herkunft in der Listenansicht und nicht in der Grafikansicht anzeigen zu lassen.

Herkunft in der Vertex AI-Benutzeroberfläche ansehen

Systeme wie Vertex AI Pipelines generieren Lineage-Daten für Vertex AI-Modelle und ‐Datasets. Sie können sich Informationen zur Datenabfolge in der Vertex AI-Benutzeroberfläche in Form eines Diagramms oder einer Liste ansehen (Vorabversion).

Herkunft eines verwalteten Datasets in Vertex AI aufrufen

So rufen Sie die Herkunftsabfolge für ein Dataset auf:

  1. Rufen Sie in der Google Cloud Console die Seite Datasets auf.

    Seite „Datasets“ öffnen

  2. Klicken Sie auf das Dataset, für das Sie die Datenherkunft sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf  Maximieren.

  6. Klicken Sie auf Liste, um die Herkunft in der Listenansicht und nicht in der Grafikansicht anzeigen zu lassen.

Lineage für ein Modell in Vertex AI ansehen

So rufen Sie die Lineage für ein Modell auf:

  1. Rufen Sie in der Google Cloud Console die Seite Model Registry auf.

    Seite „Model Registry“ öffnen

  2. Klicken Sie auf das Modell, für das Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Lineage (Herkunft).

  4. Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

  5. Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf  Maximieren.

  6. Klicken Sie auf Liste, um die Herkunft in der Listenansicht und nicht in der Grafikansicht anzeigen zu lassen.

Nächste Schritte