このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに、列の名前変更、コピー、削除、保持を行う方法について説明します。
列の名前変更
Wrangler ワークスペースで列の名前を変更するには、列名をクリックして新しい名前を入力します。Wrangler は、rename
ディレクティブをレシピに追加します。
列をコピーする
データセットで新しいディレクティブを使用することによる影響を確認するには、列を別の名前の新しい列にコピーし、そこにディレクティブを適用します。
列をコピーする手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列をコピー] を選択し、新しい列の名前を入力します。
Wrangler は列をコピーし、copy
ディレクティブをレシピに追加します。
列を削除する
列が多いデータセットの場合は、不要な列を削除することで、パイプラインのパフォーマンスを向上させ、リソースを節約できます。列が少ないほど、パイプラインの実行がより高速に完了します。これは、Joiner の変換を含むパイプラインについて特に該当します。
データセットから列を削除する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列を削除] を選択します。
Wrangler は列を削除し、drop
ディレクティブをレシピに追加します。
列を保持する
データセット内の列を保持し、他の列をすべて削除できます。
列を保持する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [列を保持] を選択します。
Wrangler は、選択された列を除き、データセット内のすべての列を削除し、keep
ディレクティブをレシピに追加します。
次のステップ
- Wrangler ディレクティブの詳細を確認する。