Pipelineausführung zu Test hinzufügen

Sie können entweder die Google Cloud Console oder das Vertex AI SDK für Python verwenden, um einem Test oder einer Testausführung einem Pipelinelauf hinzuzufügen.

Google Cloud Console

Verwenden Sie folgende Anleitung, um eine ML-Pipeline auszuführen und die Pipeline über die Google Cloud Console mit einem Test und optional einem Testlauf zu verknüpfen. Testausführungen können nur über das Vertex AI SDK für Python erstellt werden (siehe Testausführungen erstellen und verwalten).
  1. Rufen Sie in der Google Cloud Console im Abschnitt "Vertex AI" die Seite Pipelines auf.
    Zu Pipelines
  2. Wählen Sie in der Drop-down-Liste Region die Region aus, in der Sie eine Pipeline erstellen möchten.
  3. Klicken Sie auf Ausführung erstellen, um den Bereich Pipeline-Ausführung erstellen zu öffnen.
  4. Geben Sie die folgenden Ausführungsdetails an.
    • Klicken Sie im Feld Datei auf Auswählen, um die Dateiauswahl zu öffnen. Wechseln Sie zur JSON-Datei der kompilierten Pipeline, die Sie ausführen möchten, wählen Sie die Pipeline aus und klicken Sie auf Öffnen.
    • Als Pipelinename wird standardmäßig der Name verwendet, den Sie in der Pipelinedefinition angegeben haben. Geben Sie optional einen anderen Pipelinenamen an.
    • Geben Sie einen Ausführungsnamen an, um diese Pipelineausführung eindeutig zu identifizieren.
  5. Wenn Sie angeben möchten, dass diese Pipelineausführung ein benutzerdefiniertes Dienstkonto, einen vom Kunden verwalteten Verschlüsselungsschlüssel oder ein Peering-VPC-Netzwerk verwendet, klicken Sie auf Erweiterte Optionen.
    Gehen Sie nach der folgenden Anleitung vor, um erweiterte Optionen wie ein benutzerdefiniertes Dienstkonto zu konfigurieren.
    • Wählen Sie zum Angeben eines Dienstkontos ein Dienstkonto aus der Drop-down-Liste Dienstkonto aus.
      Wenn Sie kein Dienstkonto angeben, führt Vertex AI-Pipelines Ihre Pipeline mit dem Compute Engine-Standarddienstkonto aus.
      Weitere Informationen zum Konfigurieren eines Dienstkontos für die Verwendung mit Vertex AI-Pipelines.
    • Wählen Sie Vom Kunden verwalteten Verschlüsselungsschlüssel verwenden aus, um einen vom Kunden verwalteten Verschlüsselungsschlüssel (Customer-Managed Encryption Key, CMEK) zu verwenden. Die Drop-down-Liste Vom Kunden verwalteten Schlüssel auswählen wird angezeigt. Wählen Sie in der Drop-down-Liste Vom Kunden verwalteten Schlüssel auswählen den Schlüssel aus, den Sie verwenden möchten.
    • Damit Sie ein Peering-VPC-Netzwerk in dieser Pipeline verwenden können, geben Sie den Namen des VPC-Netzwerks in das Feld Peering-VPC-Netzwerk ein.
  6. Klicken Sie auf Weiter.
    Der Speicherort Cloud Storage und der Bereich Pipeline-Parameter werden angezeigt.
    • Erforderlich: Geben Sie das Cloud Storage-Ausgabeverzeichnis an, z. B. gs://location_of_directory.
    • Optional: Geben Sie die Parameter an, die Sie für diese Pipelineausführung verwenden möchten.
  7. Klicken Sie auf Senden, um die Pipelineausführung zu erstellen.
  8. Nachdem die Pipeline gesendet wurde, wird sie in der Tabelle der Pipeline-Google Cloud Console angezeigt.
  9. Klicken Sie in der Zeile, die mit der Pipeline verknüpft ist, auf  Mehr ansehen > Zum Test hinzufügen.
    • Wählen Sie einen Test aus oder erstellen Sie einen neuen Test.
    • Optional: Wenn Testausführungen mit dem Test verknüpft sind, werden sie im Drop-down-Menü angezeigt. Wählen Sie eine vorhandene Testausführung aus.
  10. Klicken Sie auf Speichern.

Pipelineausführung mit Testausführungen in der Google Cloud Console vergleichen

  1. Rufen Sie in der Google Cloud Console die Seite Tests auf.
    Zu Tests.
    Eine Liste der Tests wird auf der Seite Tests angezeigt.
  2. Wählen Sie den Test aus, dem Sie die Pipeline hinzufügen möchten.
    Es wird eine Liste der Ausführungen angezeigt.
  3. Wählen Sie die Vergleiche aus, die Sie vergleichen möchten, und klicken Sie dann auf Vergleichen
    .
  4. Klicken Sie auf Ausführung hinzufügen. Es wird eine Liste der Ausführungen angezeigt.
  5. Wählen Sie die Pipelineausführung aus, die Sie hinzufügen möchten. Die Ausführung wird hinzugefügt.

Vertex AI SDK für Python {:#sdk-add-pipeline-run}

In den folgenden Beispielen wird die PipelineJob API verwendet.

Pipeline-Ausführung mit einem Test verbinden

In diesem Beispiel wird gezeigt, wie eine Pipelineausführung mit einem Test verknüpft wird. Wenn Sie Pipelineausführungen vergleichen möchten, sollten Sie Ihre Pipelineausführungen mit einem Test verknüpfen. Weitere Informationen finden Sie in der Referenzdokumentation zum Vertex AI SDK für Python init.

Python

from typing import Any, Dict, Optional

from google.cloud import aiplatform


def log_pipeline_job_to_experiment_sample(
    experiment_name: str,
    pipeline_job_display_name: str,
    template_path: str,
    pipeline_root: str,
    project: str,
    location: str,
    parameter_values: Optional[Dict[str, Any]] = None,
):
    aiplatform.init(project=project, location=location)

    pipeline_job = aiplatform.PipelineJob(
        display_name=pipeline_job_display_name,
        template_path=template_path,
        pipeline_root=pipeline_root,
        parameter_values=parameter_values,
    )

    pipeline_job.submit(experiment=experiment_name)

  • experiment_name: Geben Sie einen Namen für den Test an. Um die Liste der Experimente in der Google Cloud Console aufzurufen, wählen Sie Tests im Navigationsbereich aus.
  • pipeline_job_display_name: Der benutzerdefinierte Name dieser Pipeline.
  • template_path: Der Pfad der PipelineJob- oder PipelineSpec-JSON- oder YAML-Datei. Dies kann ein lokaler Pfad oder ein Google Cloud Storage-URI sein. Beispiel: "gs://project.name"
  • pipeline_root: Das Stammverzeichnis der Pipelineausgaben. Standardeinstellung: Staging-Bucket.
  • parameter_values: Die Zuordnung von Laufzeitparameternamen zu den Werten, die die Pipelineausführung steuern.
  • project: Ihre Projekt-ID. Sie finden die Projekt-IDs auf der Begrüßungsseite der Google Cloud Console.
  • location: Siehe Liste der verfügbaren Standorte.

Pipeline-Ausführung mit Testausführung verknüpfen

Das bereitgestellte Beispiel beinhaltet das Verknüpfen einer Pipeline-Ausführung mit einem Testlauf.

Anwendungsfälle:

  • Wenn Sie ein lokales Modell trainieren und dann die Bewertung für dieses Modell durchführen (die Bewertung erfolgt mithilfe einer Pipeline.) In diesem Fall möchten Sie die Bewertungsmesswerte aus Ihrer Pipelineasuführung in einen ExperimentRun schreiben.
  • Wenn Dieselbe Pipeline mehrmals ausgeführt wird. Wenn Sie beispielsweise die Eingabeparameter ändern oder wenn eine Komponente fehlschlägt und Sie sie noch einmal ausführen müssen.

Wenn Sie eine Pipelineausführung mit einem Testausführung verknüpfen, werden Parameter und Messwerte nicht automatisch angezeigt und müssen manuell mithilfe der Logging-APIs protokolliert werden.

Hinweis: Wenn der optionale Parameter resume als TRUE angegeben ist, wird die zuvor gestartete Ausführung fortgesetzt. Wenn keine Angabe erfolgt, verwendet resume standardmäßig FALSE und eine neue Ausführung wird erstellt.

Siehe init, start_run und log in der Referenzdokumentation zum Vertex AI SDK für Python

Python

from google.cloud import aiplatform


def log_pipeline_job_sample(
    experiment_name: str,
    run_name: str,
    pipeline_job: aiplatform.PipelineJob,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

    aiplatform.log(pipeline_job=pipeline_job)

  • experiment_name: Geben Sie einen Namen für den Test an. Um die Liste der Experimente in der Google Cloud Console aufzurufen, wählen Sie Tests im Navigationsbereich aus.
  • run_name: Geben Sie einen Ausführungsnamen an.
  • pipeline_job: Ein Vertex AI Pipeline-Job.
  • project: Ihre Projekt-ID. Sie finden die Projekt-ID auf der Begrüßungsseite der Google Cloud Console.
  • location: Siehe Liste der verfügbaren Standorte.

Liste der Pipelineläufe in der Google Cloud Console anzeigen

  1. Rufen Sie in der Google Cloud Console im Abschnitt "Vertex AI" die Seite Pipelines auf.

    Zur Seite „Pipelines“

  2. Prüfen Sie, ob Sie sich im richtigen Projekt befinden.

  3. Eine Liste der mit den Pipelineausführungen Ihres Projekts verknüpften Tests und Testläufen wird in den Spalten Test und Testlauf angezeigt.

Vertex AI-Liste der Tests

Codelab

Nächste Schritte

Relevantes Notebookbeispiel