データのプレビュー

このページでは、Cloud Data Fusion Studio でデータをプレビューして、パイプラインをデプロイして実行する前にエラーをデバッグする方法について説明します。

エラーが発生した場合は、パイプラインがドラフトモードのときに修正できます。

Cloud Data Fusion は、ソース データセットの最初の 100 行を使用してプレビューを生成します。

プレビュー モードでは、[Studio] ページにプレビュー ジョブのステータスと所要時間が表示されます。プレビュー ジョブはいつでも停止できます。プレビュー ジョブの実行中にログイベントをモニタリングすることもできます。

Console

  1. 各ソース、変換、シンクにエラーがないことを確認します。検証するには、Cloud Data Fusion の [Studio] ページで、各プラグインのノードに移動し、[プロパティ] > [検証] をクリックします。
  2. [Studio] ページでパイプラインを表示し、[プレビュー] 切り替えボタンをクリックしてオンにします。[実行]、[時間]、[ログ] のオプションが [Studio] ページのキャンバスの上部に表示されます。
  3. 省略可: プレビュー ジョブを実行する前に、[構成] をクリックして次の設定を更新します。

    1. ランタイム引数: 詳細については、ランタイム引数を設定するをご覧ください。
    2. プレビュー設定: プレビューする行数を更新します。
    3. 詳細オプション: パイプラインとエンジンの構成を更新します。詳細については、パイプラインの構成を管理するをご覧ください。
  4. プレビュー ジョブを開始するには、[実行] をクリックします。プレビュー ジョブの実行時にシンクにデータは書き込まれませんが、パイプラインをデプロイするときに、データが想定どおりに読み取られ、書き込まれることを確認できます。

  5. 省略可: プレビュー ジョブの実行後に、パイプラインの各ステージでのデータの状態を確認するには、ソース、シンク、変換など、データを処理するパイプラインのノードで [データをプレビュー] をクリックします。

  6. データのプレビューが完了したら、[プレビュー] 切り替えボタンをオフにして、プレビュー モードを終了します。

次のステップ