パイプラインのスケジュール

このページでは、パイプライン実行のスケジュールを作成する方法について説明します。たとえば、毎日午前 1 時(UTC)にパイプラインを実行するようにスケジュールできます。

始める前に

スケジュールを作成するには、Cloud Data Fusion にパイプラインをデプロイする必要があります。パイプラインがない場合は、クイックスタートに従ってパイプラインを作成できます。

スケジュールを作成、編集、一時停止するには、Cloud Data Fusion でパイプラインを開きます。

  1. Google Cloud Console で、[インスタンス] ページに移動します。

    [インスタンス] に移動

  2. [インスタンスの表示] をクリックします。

    Cloud Data Fusion UI が開きます。

  3. Cloud Data Fusion の [リスト] ページに移動します。

  4. [デプロイ済み] タブで、目的のパイプラインを選択します。

    [パイプライン] ページが開きます。ここで、パイプラインのスケジュールを作成、編集、一時停止できます。

スケジュールの作成

Cloud Data Fusion UI の [パイプライン] ページで、[スケジュール] をクリックします。

[基本] タブまたは [詳細] タブを使用して、スケジュールを定義できます。[詳細] タブでは、unix-cron 形式を使用して複雑なスケジュールを定義できます。

基本

  1. [基本] タブで、スケジュールに関する次の情報を入力します。

    • 頻度
    • 開始時刻(UTC 形式)。
    • 省略可: 日付
    • 最大同時実行数(最大 10 回の実行) すでに 10 個のパイプラインが実行中の場合、作成するスケジュール済み実行は実行されません。
    • 省略可: Compute Engine プロファイル。ここを空白のままにすると、デフォルトの Dataproc プロファイルが使用されます。
  2. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

詳細

  1. [詳細] タブで unix-cron 形式を使用してスケジュールを定義します。

    パイプラインを 1 日に複数回、または特定の月や月に実行するようにスケジュールできます。

    時間項目の形式と有効な値を次の表に示します。

    項目 有効な値の形式
    059
    時間 023
    131
    112
    曜日 06(日曜日は 0、月曜日は 1
  2. [スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。

スケジュールを変更または停止する

Cloud Data Fusion UI の [パイプライン] ページから、パイプライン スケジュールを変更または一時停止できます。

  • スケジュールを変更するには、[構成] をクリックし、フィールドを更新します。

  • スケジュールを停止するには、[Unschedule] をクリックします。