配置失败政策

您可以使用 aiplatform.PipelineJob 类的 failure_policy 参数来配置在其中一个任务失败时流水线是否应立即失败。

Vertex AI Pipelines 支持以下失败政策配置:

  • 快速失败 (failure_policy = 'fast'):如果您希望流水线在任务失败后停止安排新任务,请选择此配置。已安排的任务将继续运行,直到完成。

  • 缓慢失败 (failure_policy = 'slow'):如果您希望即使在任务失败后流水线也继续运行,也请选择此配置。流水线会继续运行,直至所有任务都被执行。

使用以下代码示例为使用 Python 版 Vertex AI SDK 的流水线配置失败政策:


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

请替换以下内容:

  • DISPLAY_NAME:流水线的名称,此名称将显示在 Google Cloud 控制台中。

  • COMPILED_PIPELINE_PATH:已编译的流水线 YAML 文件的路径。该路径可以是本地路径或 Google Cloud Storage URI。

  • PIPELINE_ROOT:指定流水线服务账号可以访问的 Cloud Storage URI。流水线运行的工件存储在流水线根目录中。

  • PROJECT_ID:在其中运行此流水线的 Google Cloud 项目。

  • LOCATION:流水线在其中运行的区域。如需详细了解支持 Vertex AI Pipelines 的区域,请参阅 Vertex AI 位置指南。如果您未设置此参数,则使用 aiplatform.init 中设置的默认位置。

  • FAILURE_POLICY:指定整个流水线的失败政策。您可以使用以下配置:

    • 如需将流水线配置为在任务失败后失败,请输入 fast

    • 如需将流水线配置为在任务失败后继续安排任务,请输入 slow

    如果您未设置此参数,则失败政策配置默认设置为 slow