このページでは、パイプライン実行のスケジュールを作成する方法について説明します。たとえば、毎日午前 1 時(UTC)にパイプラインを実行するようにスケジュールできます。
始める前に
スケジュールを作成するには、Cloud Data Fusion にパイプラインをデプロイする必要があります。パイプラインがない場合は、クイックスタートに従ってパイプラインを作成できます。
スケジュールを作成、編集、一時停止するには、Cloud Data Fusion でパイプラインを開きます。
Google Cloud Console で、[インスタンス] ページに移動します。
[インスタンスの表示] をクリックします。
Cloud Data Fusion UI が開きます。
Cloud Data Fusion の [リスト] ページに移動します。
[デプロイ済み] タブで、目的のパイプラインを選択します。
[パイプライン] ページが開きます。ここで、パイプラインのスケジュールを作成、編集、一時停止できます。
スケジュールの作成
Cloud Data Fusion UI の [パイプライン] ページで、[スケジュール] をクリックします。
[基本] タブまたは [詳細] タブを使用して、スケジュールを定義できます。[詳細] タブでは、unix-cron 形式を使用して複雑なスケジュールを定義できます。
基本
[基本] タブで、スケジュールに関する次の情報を入力します。
- 頻度
- 開始時刻(UTC 形式)。
- 省略可: 日付
- 最大同時実行数(最大 10 回の実行) すでに 10 個のパイプラインが実行中の場合、作成するスケジュール済み実行は実行されません。
- 省略可: Compute Engine プロファイル。ここを空白のままにすると、デフォルトの Dataproc プロファイルが使用されます。
[スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。
詳細
[詳細] タブで unix-cron 形式を使用してスケジュールを定義します。
パイプラインを 1 日に複数回、または特定の月や月に実行するようにスケジュールできます。
時間項目の形式と有効な値を次の表に示します。
項目 有効な値の形式 分 0
~59
時間 0
~23
日 1
~31
月 1
~12
曜日 0
~6
(日曜日は0
、月曜日は1
)[スケジュールを保存して開始](スケジュールを後で開始する場合は、[スケジュールを保存])をクリックします。
スケジュールを変更または停止する
Cloud Data Fusion UI の [パイプライン] ページから、パイプライン スケジュールを変更または一時停止できます。
スケジュールを変更するには、[構成] をクリックし、フィールドを更新します。
スケジュールを停止するには、[Unschedule] をクリックします。