列の名前変更、コピー、削除、保持

このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに、列の名前変更、コピー、削除、保持を行う方法について説明します。

列の名前変更

Wrangler ワークスペースで列の名前を変更するには、列名をクリックして新しい名前を入力します。Wrangler は、rename ディレクティブをレシピに追加します。

列をコピーする

データセットで新しいディレクティブを使用する影響を確認するには、列を別の名前の新しい列にコピーし、そこにディレクティブを適用します。

列をコピーする手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [列をコピー] を選択し、新しい列の名前を入力します。

Wrangler は列をコピーし、copy ディレクティブをレシピに追加します。

列を削除する

列が多いデータセットの場合は、不要な列を削除することで、パイプラインのパフォーマンスを向上させ、リソースを節約できます。列が少ないほど、パイプラインの実行が完了する速度が速くなります。これは、結合変換を含むパイプラインで特に当てはまります。

データセットから列を削除する手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [列を削除] を選択します。

Wrangler は列を削除し、drop ディレクティブをレシピに追加します。

列を保持する

データセット内の列を保持し、他の列をすべて削除できます。

列を保持する手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [列を保持] を選択します。

Wrangler は、選択した列を除き、データセット内のすべての列を削除し、keep ディレクティブをレシピに追加します。

次のステップ