Die Datenherkunft zeigt die Beziehungen zwischen den Ressourcen Ihres Projekts und den Prozessen, die sie erstellt haben.
Sie können Informationen zur Datenabfolge in der Google Cloud Console in den folgenden Formen aufrufen:
- Abstammungsdiagramm: Zeigt die Abfolge von Einträgen, die vor oder nach einem einzelnen Stammeintrag liegen. Weitere Informationen finden Sie unter Abstammungsdiagramm.
- Visualisierung des Herkunftspfads (Vorabversion): Hier sehen Sie die Herkunftsverbindungen zwischen zwei ausgewählten Ressourcen. Weitere Informationen finden Sie unter Visualisierung des Abfolgepfads.
- Listansicht der Datenherkunft (Vorabversion): Hier werden detaillierte Informationen zur Datenherkunft für Ressourcen in einer einzigen Tabelle angezeigt, einschließlich Informationen zur Datenherkunft für Ressourcen mit vielen Verbindungen. Weitere Informationen finden Sie unter Listansicht der Abfolge.
Sie können Informationen zur Herkunft auch in Form von JSON-Daten über die Data Lineage API abrufen.
Die Abfolge wird projektübergreifend erfasst. Wenn Sie eine Abfolge aufrufen, die aus mehreren Projekten generiert wurde, können Sie die aggregierten Abfolgeinformationen in jedem der entsprechenden Projekte aufrufen.
Rollen und Berechtigungen
Wenn Sie Informationen zur Datenherkunft aufrufen möchten, bitten Sie Ihren Administrator, Ihnen die Rollen „Betrachter“ zuzuweisen, wie unter Vordefinierte Rollen für die Datenherkunft beschrieben. Sie benötigen Zugriff sowohl auf das Projekt, in dem Sie die Abfolge aufrufen, als auch auf die Projekte, in denen die Abfolge aufgezeichnet wird.
Dataplex erfasst Informationen zur Herkunft automatisch, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrollen, um die Herkunft Ihrer Daten-Assets zu erfassen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten. Sie können eine Rolle auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).
Datenabfolge aktivieren
Aktivieren Sie die Data Lineage, um automatisch Informationen zur Datenherkunft für unterstützte Systeme zu erfassen. Sie müssen die Data Lineage API sowohl in dem Projekt aktivieren, in dem Sie die Datenabfolge aufrufen, als auch in den Projekten, in denen die Datenabfolge aufgezeichnet wird. Weitere Informationen finden Sie unter Projekttypen.
So erfassen Sie Informationen zur Herkunft:
-
Wählen Sie in der Google Cloud Console auf der Seite Projektauswahl das Projekt aus, in dem Sie die Herkunft aufzeichnen möchten.
Aktivieren Sie die Data Lineage API.
- Wiederholen Sie die vorherigen Schritte für jedes Projekt, für das Sie die Herkunft aufzeichnen möchten.
-
Aktivieren Sie in dem Projekt, in dem Sie die Herkunft ansehen, die Data Lineage API und die Dataplex API.
Lineage in Dataplex ansehen
Informationen zur Datenherkunft finden Sie in der Dataplex-Weboberfläche.
So rufen Sie die Abfolge auf:
Öffnen Sie die Suchseite des Dataplex-Katalogs und suchen Sie nach dem Asset, für das Sie Informationen zur Herkunft aufrufen möchten.
Weitere Informationen finden Sie unter Nach Ressourcen im Dataplex Catalog suchen.Wählen Sie auf der Seite mit den Eintragsdetails den Tab Abstammung aus.
Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.
Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.
Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf
Maximieren.
Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.
Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.
Herkunft in BigQuery ansehen
Informationen zur Datenabfolge finden Sie in der BigQuery-Weboberfläche.
So rufen Sie die Abfolge auf:
- Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Öffnen Sie die Tabelle, für die Sie die Datenabfolge sehen möchten.
Klicken Sie auf den Tab Abstammung.
Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.
Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.
Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf
Maximieren.
Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.
Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.
Herkunft in Vertex AI ansehen
Systeme wie Vertex AI Pipelines generieren Abstammungsdaten für Vertex AI-Modelle und ‑Datasets. Sie können Informationen zur Datenabfolge in der Vertex AI-Weboberfläche aufrufen.
Herkunft eines verwalteten Datasets in Vertex AI aufrufen
So rufen Sie die Herkunftsabfolge für ein Dataset auf:
- Rufen Sie in der Google Cloud Console die Seite Datasets auf.
Klicken Sie auf das Dataset, für das Sie die Datenabfolge sehen möchten.
Klicken Sie auf den Tab Abstammung.
Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.
Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.
Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf
Maximieren.
Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.
Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.
Herkunft eines Modells in Vertex AI ansehen
So rufen Sie die Abfolge für ein Modell auf:
Rufen Sie in der Google Cloud Console die Seite Model Registry auf.
Klicken Sie auf das Modell, für das Sie die Datenabfolge sehen möchten.
Klicken Sie auf den Tab Abstammung.
Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.
Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.
Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf
Maximieren.
Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.
Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.