パイプラインをデプロイして実行する

このページでは、Cloud Data Fusion にパイプラインをデプロイして実行する基本事項について説明します。

パイプラインをデプロイする

データ パイプラインの設計とデバッグが完了し Preview に表示されるデータが満足するものであれば、パイプラインをデプロイする準備が整いました

パイプラインをデプロイすると、Cloud Data Fusion Studio は、ワークフローと対応する Apache Spark ジョブをバックグラウンドで実行します。

パイプラインを実行する

パイプラインをデプロイした後は、次の方法でパイプラインを実行できます。

  • オンデマンドでパイプラインを実行するには、デプロイしたパイプラインを開いて [実行] をクリックします。
  • 特定の時間に実行するようにパイプラインをスケジュール設定するには、デプロイしたパイプラインを開き、[スケジュール] をクリックします。
  • 別のパイプラインが完了したときにパイプラインをトリガーするには、デプロイしたパイプラインを開き、[受信トリガー] をクリックします。

Pipeline Studio は、実行されるたびにパイプラインの履歴を保存します。パイプラインのランタイム バージョンは、切り替えることができます。

パイプラインにマクロがある場合は、マクロごとにランタイム引数を設定します。デプロイしたパイプラインを実行する前にパイプライン構成を確認して変更することもできます。パイプライン実行の各フェーズにおいて、ステータスが ProvisioningStartingRunningSucceeded と変わることが確認できます。パイプラインはいつでも停止できます。

インストルメンテーションを有効にすると、パイプラインにある任意のノード(ソース、変換、シンクなど)で [Properties] をクリックすることにより、パイプラインが生成した指標を調べることができます。

パイプライン実行の続きについては、[概要] をクリックしてください。

次のステップ