パイプラインをスケジュールする

このページでは、パイプライン実行のスケジュールを作成する方法について説明します。たとえば、毎日午前 1 時(UTC)にパイプラインを実行するようにスケジュールできます。

始める前に

スケジュールを作成するには、Cloud Data Fusion にデプロイされたパイプラインが必要です。ない場合は、次のクイックスタートに沿ってパイプラインを作成できます。

スケジュールを作成、編集、または一時停止するには、Cloud Data Fusion でパイプラインを開きます。

  1. インスタンス(

    1. Google Cloud コンソールで、Cloud Data Fusion のページに移動します。

    2. Cloud Data Fusion ウェブ インターフェースでインスタンスを開くには、[Instances] をクリックしてから、[View instance] をクリックします。

      [インスタンス] に移動

    )に移動します。

  2. Cloud Data Fusion の [リスト] ページに移動します。

  3. [デプロイ済み] タブで、目的のパイプラインを選択します。

    [パイプライン] ページが開き、パイプラインのスケジュールを作成、編集、一時停止できます。

スケジュールを作成する

Cloud Data Fusion UI の [パイプライン] ページで、[スケジュール] をクリックします。

[基本] タブまたは [詳細] タブを使用して、スケジュールを定義できます。[詳細] タブでは、unix-cron 形式を使用して複雑なスケジュールを定義できます。

基本

  1. [基本] タブで、スケジュールに関する次の情報を入力します。

    • 頻度
    • 開始時刻(UTC 形式)。
    • 省略可: 日付
    • 最大同時実行数(最大 10 回の実行)。すでに 10 個のパイプラインが実行中の場合、作成するスケジュール済み実行は実行されません。
    • 省略可: Compute Engine プロファイル。ここを空白のままにすると、デフォルトの Dataproc プロファイルが使用されます。
  2. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

詳細

  1. [詳細] タブで unix-cron 形式を使用してスケジュールを定義します。

    パイプラインを 1 日に複数回、または特定の日や月に実行するようにスケジュールできます。

    時間項目の形式と有効な値を次の表に示します。

    項目 有効な値の形式
    059
    時間 023
    131
    112
    曜日 06(日曜日は 0、月曜日は 1
  2. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

スケジュールを変更または一時停止する

Cloud Data Fusion UI の [パイプライン] ページから、パイプライン スケジュールを変更または一時停止できます。

  • スケジュールを変更するには、[構成] をクリックし、フィールドを更新します。

  • スケジュールを一時停止するには、[Unschedule] をクリックします。