aiplatform.PipelineJob
クラスの failure_policy
パラメータを使用すると、いずれかのタスクが失敗した場合にパイプラインが直ちに失敗するかどうかを構成できます。
Vertex AI Pipelines では、次の障害ポリシー構成がサポートされています。
フェイル ファスト(
failure_policy = 'fast'
): タスクの失敗後にパイプラインが新しいタスクのスケジュール設定を停止するように設定する場合は、この構成を選択します。すでにスケジュールされているタスクは、完了するまで実行されます。フェイルスロー(
failure_policy = 'slow'
): タスクが失敗した後もパイプラインの実行を継続する場合は、この構成を選択します。パイプラインは、すべてのタスクが実行されるまで実行され続けます。
Vertex AI SDK for Python を使用してパイプラインの障害ポリシーを構成するには、次のコードサンプルを使用します。
job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
template_path = 'COMPILED_PIPELINE_PATH',
pipeline_root = 'PIPELINE_ROOT',
project = 'PROJECT_ID',
location = 'LOCATION',
failure_policy = 'FAILURE_POLICY')
次のように置き換えます。
DISPLAY_NAME: パイプラインの名前。Google Cloud コンソールに表示されます。
COMPILED_PIPELINE_PATH: コンパイルされたパイプライン YAML ファイルのパス。ローカルパスまたは Google Cloud Storage URI を指定できます。
PIPELINE_ROOT: パイプライン サービス アカウントがアクセスできる Cloud Storage URI を指定します。パイプライン実行のアーティファクトはパイプライン ルート内に保存されます。
PROJECT_ID: このパイプラインが実行される Google Cloud プロジェクト。
LOCATION: パイプラインが実行されるリージョン。Vertex AI Pipelines が利用可能なリージョンの詳細については、Vertex AI ロケーション ガイドをご覧ください。このパラメータを設定しないと、
aiplatform.init
で設定されたデフォルトのロケーションが使用されます。FAILURE_POLICY: 省略可。パイプライン全体の障害ポリシーを指定します。次の構成を使用できます。
1 つのタスクが失敗した後、パイプラインが失敗するように構成するには、「
fast
」と入力します。1 つのタスクが失敗した後もタスクのスケジュールを継続するようにパイプラインを構成するには、「
slow
」と入力します。
このパラメータを設定しないと、エラーポリシーの構成はデフォルトの
slow
に設定されます。
次のステップ
- 失敗したパイプライン タスクの再試行の構成方法を学習する。