安排流水线

本页介绍了如何为流水线运行创建时间安排。例如,您可以安排在每天凌晨 1:00(世界协调时间 (UTC))运行流水线。

准备工作

如需创建时间安排,您需要在 Cloud Data Fusion 中有一个已部署的流水线。如果没有该流水线,则可以按照快速入门来创建流水线。

如需创建、修改或暂停时间安排,请在 Cloud Data Fusion 中打开流水线:

  1. 前往您的实例:

    1. 在 Google Cloud 控制台中,前往 Cloud Data Fusion 页面。

    2. 如需在 Cloud Data Fusion Studio 中打开实例,请点击实例,然后点击查看实例

      转到实例

  2. 转到 Cloud Data Fusion 列表页面。

  3. 已部署标签页中,选择一个流水线。

    此时会打开流水线页面,您可以在其中为流水线创建、修改或暂停时间安排。

创建时间安排

在 Cloud Data Fusion Studio 的流水线页面中,点击时间安排

您可以使用基本高级标签页来定义时间安排。

基本

  1. 基本标签页上,输入以下有关时间安排的信息:

    • 频率,例如 Every 5 minutesRepeats every 30 days
    • 开始时间(世界协调时间)。
    • 并发运行次数上限:最多选择 10 次运行。如果已运行了 10 次流水线,则您创建的预定运行将不会运行。
    • Compute Engine 配置文件:选择计算配置文件。默认是 Dataproc 计算配置文件。
  2. 点击保存并启动时间安排 (Save and start schedule),或者如果您希望稍后启动,请点击保存时间安排 (Save schedule)。

高级

  1. 高级标签页上,使用 Cron 语法定义时间安排。
  2. 并发运行次数上限字段中,选择最多 10 次运行。如果已运行了 10 次流水线,则您创建的预定运行将不会运行。
  3. 点击保存并启动时间安排 (Save and start schedule),或者如果您希望稍后启动,请点击保存时间安排 (Save schedule)。

更改或暂停时间安排

  • 您可以在 Cloud Data Fusion Studio 的流水线页面中更改、启动或暂停流水线时间安排。

  • 如需暂停时间安排,请点击取消时间安排