您可以使用 aiplatform.PipelineJob
类的 failure_policy
参数来配置在其中一个任务失败时流水线是否应立即失败。
Vertex AI Pipelines 支持以下失败政策配置:
快速失败 (
failure_policy = 'fast'
):如果您希望流水线在任务失败后停止安排新任务,请选择此配置。已安排的任务将继续运行,直到完成。缓慢失败 (
failure_policy = 'slow'
):如果您希望即使在任务失败后流水线也继续运行,也请选择此配置。流水线会继续运行,直至所有任务都被执行。
使用以下代码示例为使用 Python 版 Vertex AI SDK 的流水线配置失败政策:
job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
template_path = 'COMPILED_PIPELINE_PATH',
pipeline_root = 'PIPELINE_ROOT',
project = 'PROJECT_ID',
location = 'LOCATION',
failure_policy = 'FAILURE_POLICY')
请替换以下内容:
DISPLAY_NAME:流水线的名称,此名称将显示在 Google Cloud 控制台中。
COMPILED_PIPELINE_PATH:已编译的流水线 YAML 文件的路径。该路径可以是本地路径或 Google Cloud Storage URI。
PIPELINE_ROOT:指定流水线服务账号可以访问的 Cloud Storage URI。流水线运行的工件存储在流水线根目录中。
PROJECT_ID:在其中运行此流水线的 Google Cloud 项目。
LOCATION:流水线在其中运行的区域。如需详细了解支持 Vertex AI Pipelines 的区域,请参阅 Vertex AI 位置指南。如果您未设置此参数,则使用
aiplatform.init
中设置的默认位置。FAILURE_POLICY:指定整个流水线的失败政策。您可以使用以下配置:
如需将流水线配置为在任务失败后失败,请输入
fast
。如需将流水线配置为在任务失败后继续安排任务,请输入
slow
。
如果您未设置此参数,则失败政策配置默认设置为
slow
。