このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに、列値を結合して列名を入れ替える方法について説明します。
2 つの列を結合する
Wrangler ワークスペースは、同じデータ型または異なるデータ型の 2 つの列の結合をサポートしています。JOIN
オペレーションの出力は、両方の列から結合されたフィールドを含む新しい列に格納されます。Wrangler は、ブール型とバイト型の列の他の列との結合をサポートしていません。
2 つの列を結合する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで、2 つの列名のチェックボックスをオンにします。
- いずれかの列名の横にある arrow_drop_down 展開矢印をクリックします。
- [2 つの列を結合] を選択し、[カスタム選択] などのオプションを選択します。
JOIN
オペレーションの出力の順序、区切り文字、新しい列名を選択します。- [参加] をクリックします。
Wrangler は列を結合し、merge
ディレクティブをレシピに追加します。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。
2 つの列名を入れ替える
Wrangler ワークスペースは、2 つの列名の入れ替え(交換)をサポートしています。 列名のみが入れ替わり、列の行の値は変更されません。
2 つの列名を入れ替える手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで、2 つの列名のチェックボックスをオンにします。
- いずれかの列名の横にある arrow_drop_down 展開矢印をクリックします。
- [2 つの列名を入れ換える] を選択します。
Wrangler は列名を入れ替え、swap
ディレクティブをレシピに追加します。
次のステップ
- Wrangler ディレクティブの詳細を確認する。