Diese Seite wurde von der Cloud Translation API übersetzt.

Herkunft von Pipeline-Artefakten verfolgen

Jede mit Vertex AI Pipelines erstellte Pipeline-Ausführung umfasst mehrere zugehörige Artefakte und Parameter, z. B. Modelle, Datasets, Pipeline-Vorlagen und Komponenten. Die Herkunft eines Pipeline-Artefakts umfasst die Faktoren, die zu seiner Erstellung beigetragen haben, sowie Artefakte und Metadaten, die vom Artefakt abgeleitet wurden. Die Abstammung eines Modells kann zum Beispiel Folgendes enthalten:

Die Trainings-, Test- und Evaluationsdaten, die zum Erstellen des Modells verwendet wurden.
Die Hyperparameter, die während des Modelltrainings verwendet werden.
Metadaten, die aus dem Trainings- und Bewertungsprozess aufgezeichnet wurden, z. B. die Genauigkeit des Modells.
Artefakte, die von diesem Modell abstammen, z. B. die Ergebnisse von Batchvorhersagen.

Sie können mit diesen Metadaten die folgenden Fragen beantworten:

Warum hat ein bestimmter Pipeline-Ausführung ein besonders genaues Modell erzeugt?
Welche Pipelineausführung hat das genaueste Modell generiert und welche Hyperparameter wurden zum Trainieren des Modells verwendet?
Abhängig von den Schritten in Ihrer Pipeline können Sie möglicherweise System-Governance-Fragen beantworten. Mit Metadaten können Sie beispielsweise feststellen, welche Version Ihres Modells zu einem bestimmten Zeitpunkt in der Produktion war.

Zum Aufrufen und Analysieren der Herkunft des Pipeline-Artefakts können Sie entweder Vertex ML Metadata oder Dataplex Universal Catalog verwenden.

In der folgenden Tabelle werden die Unterschiede zwischen Vertex ML Metadata und Dataplex Universal Catalog beschrieben:

Funktion	Vertex ML Metadata	Dataplex Universal Catalog
Arten von erfassten Pipeline-Metadaten	Alle Eingabe- und Ausgabeartefakte, die von einer Pipelineausführung erzeugt werden.	Eingabe- und Ausgabeartefakte, die vollständig qualifizierten Namen (FQNs) zugeordnet werden können, die von Dataplex Universal Catalog unterstützt werden, in der Regel mithilfe von Google Cloud Pipeline-Komponenten.
Geografie	Lesevorgänge für einzelne Regionen.	Globale Lesevorgänge, also über mehrere Regionen hinweg.
Projekte	Lesevorgänge für einzelne Projekte	Organisationsweite Lesevorgänge in mehreren Projekten.
Integrierte Dienste	Eingebunden in Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry und Datasets.	In mehrere Google Cloud -Produkte wie Vertex AI, BigQuery, Cloud Composer und Dataproc eingebunden.
Aktivieren?	Nein, immer an.	Führen Sie ein Opt-in pro Projekt aus, indem Sie die Data Lineage API aktivieren.

Vertex ML-Metadatenartefakte Dataplex Universal Catalog zuordnen

So ordnen Sie Vertex ML-Metadatenartefakte den FQNs in Dataplex Universal Catalog zu:

Verwenden Sie Google Cloud Pipeline-Komponenten beim Erstellen von Vertex AI-Modellen und verwalteten Datasets.
Verwenden Sie benutzerdefinierte Schematitel (google.VertexDataset oder google.VertexModel), wenn Sie den Ressourcennamen des Modells oder des verwalteten Datasets im Feld metadata angeben, wie im folgenden Beispiel dargestellt:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Herkunft von Pipeline-Artefakten mit Vertex ML Metadata analysieren

Wenn Sie eine Pipeline mit Vertex AI Pipelines ausführen, werden die Artefakte und Parameter der Pipeline-Ausführung mithilfe von Vertex ML Metadata gespeichert. Vertex ML Metadata erleichtern die Analyse der Herkunft der Artefakte Ihrer Pipeline, da Sie auf diese Weise die Metadaten Ihrer Pipeline nicht verfolgen müssen.

Wenn Sie mit Vertex ML Metadata noch nicht vertraut sind, lesen Sie die Einführung in Vertex ML Metadata.

Folgen Sie dieser Anleitung, um das Herkunftsdiagramm für ein Pipeline-Artefakt mithilfe von Vertex ML Metadata aufzurufen:

Rufen Sie in der Google Cloud Console im Abschnitt „Vertex AI“ die Seite Metadaten auf.

Zur Seite "Metadaten"

Auf der Seite „Metadaten“ werden die Artefakte aufgeführt, die im Standard-Metadatenspeicher erstellt wurden.
Wählen Sie in der Drop-down-Liste Region die Region aus, in der Ihre Ausführung erstellt wurde.
Klicken Sie auf den Anzeigenamen eines Artefakts, um dessen Herkunftsdiagramm zu sehen.

Es wird eine statische Grafik mit den Artefakten und Ausführungen angezeigt, die Teil dieses Herkunftsdiagramms sind.
Klicken Sie auf ein Artefakt oder auf eine Ausführung, um mehr darüber zu erfahren.

Herkunft von Pipeline-Artefakten mit Dataplex Universal Catalog analysieren

Dataplex Universal Catalog erkennt Metadaten ausGoogle Cloud -Ressourcen, darunter Vertex AI Pipelines-Artefakte wie Vertex AI-Modelle, verwaltete Datasets und andereGoogle Cloud -Ressourcen, die in Dataplex Universal Catalog gefunden werden können. Sie können diese Artefakte mit der Metadatensuchfunktion von Dataplex Universal Catalog ermitteln und die zugehörigen Herkunftsdiagramme aufrufen.

Weitere Informationen zur Suchfunktion von Dataplex Universal Catalog für Metadaten finden Sie unter Nach Ressourcen in Dataplex Universal Catalog suchen.

Beachten Sie, dass Dataplex Universal Catalog möglicherweise nicht in allen Regionen verfügbar ist, in denen Vertex AI Pipelines unterstützt wird. Wenn Dataplex Universal Catalog in Ihrer Region nicht unterstützt wird, verwenden Sie Vertex ML Metadata. Liste der unterstützten Regionen für Dataplex Universal Catalog ansehen

So rufen Sie das Herkunftsdiagramm für ein Pipeline-Artefakt in Dataplex Universal Catalog auf:

Rufen Sie zum Starten einer Dataplex Universal Catalog-Suchanfrage in der Google Cloud Console die Dataplex Universal Catalog-Seite Suche auf.

Zur Suche
Wählen Sie Dataplex Universal Catalog als Suchmodus aus.
Verwenden Sie die Filter, um nach den Artefakten zu suchen. Mit dem Filter Datentypen können Sie beispielsweise den Artefakttyp angeben, z. B. Modell, Dataset oder BigQuery-Tabelle. Weitere Informationen finden Sie unter Nach Ressourcen im Dataplex Universal Catalog suchen.

Sie können Ihre Abfrage auch im Suchfeld definieren.
Klicken Sie auf den Namen eines Artefakts und dann auf den Tab Herkunft, um die Herkunft eines Artefakts anzusehen.

Im Herkunftsdiagramm ist den Vertex AI-Prozessen vorangestellt. Dazu gehören Pipeline-Artefakte, Pipeline-Komponenten und Pipelinevorlagen.
- Klicken Sie auf den Prozess im Herkunftsdiagramm, um die Details zu einem Prozess aufzurufen.
  
  Hinweis: Die Prozessdetails sind nur verfügbar, wenn der Prozess in Dataplex Universal Catalog mit einem voll qualifizierten Namen (FQN) katalogisiert wurde.
- Für Prozesse, die auf Pipelineaufgaben aus Pipelineausführungen basieren, können Sie so vorgehen:
  - Rufen Sie die Pipeline-Ausführung in Vertex AI auf. Klicken Sie dazu auf dem Tab Details auf In Vertex AI öffnen. Klicken Sie auf Mehr, um die Laufzeitdetails einer Pipelineausführung wie Status, Zeitstempel und Attribute aufzurufen. Klicken Sie zum Aufrufen der Pipelineausführung in Vertex AI auf In Vertex AI öffnen.
- Für Prozesse, die auf einer Pipelinevorlage basieren, können Sie Folgendes tun:
  - Rufen Sie die Vorlagendetails in Vertex AI auf. Klicken Sie dazu auf dem Tab Details auf In Vertex AI öffnen.
  - Rufen Sie die Liste der Pipelineaufgaben, die in Pipelineausführungen erstellt wurden, auf dem Tab Ausführungen auf. Um die Details der Pipelinevorlage in Vertex AI aufzurufen, klicken Sie auf Mehr und dann auf In Vertex AI öffnen.

Nächste Schritte

Pipeline ausführen.
Erste Schritte mit der Visualisierung und Analyse der Pipelineergebnisse.
Pipeline für maschinelles Lernen erstellen