Fehlerrichtlinie konfigurieren

Sie können den failure_policy-Parameter der aiplatform.PipelineJob-Klasse verwenden, um zu konfigurieren, ob eine Pipeline sofort fehlschlagen soll, wenn eine der Aufgaben fehlschlägt.

Die folgenden Konfigurationen von Ausfallrichtlinien werden in Vertex AI Pipelines unterstützt:

  • Fail fast (failure_policy = 'fast'): Wählen Sie diese Konfiguration aus, wenn die Pipeline keine neuen Aufgaben mehr planen soll, nachdem eine Aufgabe fehlgeschlagen ist. Bereits geplante Aufgaben werden weiterhin ausgeführt, bis sie abgeschlossen sind.

  • Fail slow (failure_policy = 'slow'): Wählen Sie diese Konfiguration aus, wenn die Pipeline auch nach dem Fehlschlagen einer Aufgabe weiter ausgeführt werden soll. Die Pipeline wird so lange ausgeführt, bis alle Aufgaben ausgeführt wurden.

Mit dem folgenden Codebeispiel können Sie die Fehlerrichtlinie für eine Pipeline mit dem Vertex AI SDK für Python konfigurieren:


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

Dabei gilt:

  • DISPLAY_NAME: Der Name der Pipeline, der in der Google Cloud Console angezeigt wird.

  • COMPILED_PIPELINE_PATH: Der Pfad zur kompilierten Pipeline-YAML-Datei. Dies kann ein lokaler Pfad oder ein Google Cloud Storage-URI sein.

  • PIPELINE_ROOT: Geben Sie einen Cloud Storage-URI an, auf den das Pipelines-Dienstkonto zugreifen kann. Die Artefakte Ihrer Pipelineausführungen werden im Pipeline-Stammverzeichnis gespeichert.

  • PROJECT_ID: Das Google Cloud-Projekt, in dem diese Pipeline ausgeführt wird.

  • LOCATION: Die Region, in der die Pipeline ausgeführt wird. Weitere Informationen zu den Regionen, in denen Vertex AI Pipelines verfügbar ist, finden Sie in der Anleitung zu Vertex AI-Standorten. Wenn Sie diesen Parameter nicht festlegen, wird der in aiplatform.init festgelegte Standardstandort verwendet.

  • FAILURE_POLICY: Geben Sie die Fehlerrichtlinie für die gesamte Pipeline an. Folgende Konfigurationen sind verfügbar:

    • Geben Sie fast ein, um die Pipeline so zu konfigurieren, dass sie fehlschlägt, nachdem eine Aufgabe fehlgeschlagen ist.

    • Geben Sie slow ein, um die Pipeline so zu konfigurieren, dass verbleibende Aufgaben nach dem Fehlschlagen einer Aufgabe weiter ausgeführt werden.

    Wenn Sie diesen Parameter nicht festlegen, wird die Konfiguration der Fehlerrichtlinie standardmäßig auf slow gesetzt.