このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに、列の名前変更、コピー、削除、保持を行う方法について説明します。
列の名前変更
Wrangler ワークスペースで列の名前を変更するには、列名をクリックして新しい名前を入力します。Wrangler は、rename
ディレクティブをレシピに追加します。
列をコピーする
データセットで新しいディレクティブを使用する影響を確認するには、列を別の名前の新しい列にコピーし、そこにディレクティブを適用します。
列をコピーする手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列をコピー] を選択し、新しい列の名前を入力します。
Wrangler は列をコピーし、copy
ディレクティブをレシピに追加します。
列を削除する
列が多いデータセットの場合は、不要な列を削除することで、パイプラインのパフォーマンスを向上させ、リソースを節約できます。列が少ないほど、パイプラインの実行が完了する速度が速くなります。これは、結合変換を含むパイプラインで特に当てはまります。
データセットから列を削除する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列を削除] を選択します。
Wrangler は列を削除し、drop
ディレクティブをレシピに追加します。
列を保持する
データセット内の列を保持し、他の列をすべて削除できます。
列を保持する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列を保持] を選択します。
Wrangler は、選択した列を除き、データセット内のすべての列を削除し、keep
ディレクティブをレシピに追加します。
次のステップ
- Wrangler ディレクティブの詳細を確認する。