2 つの列の結合と入れ替え

このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに、列値を結合して列名を入れ替える方法について説明します。

2 つの列を結合する

Wrangler ワークスペースは、同じデータ型または異なるデータ型の 2 つの列の結合をサポートしています。JOIN オペレーションの出力は、両方の列から結合されたフィールドを含む新しい列に格納されます。Wrangler は、ブール型とバイト型の列の他の列との結合をサポートしていません。

2 つの列を結合する手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで、2 つの列名のチェックボックスをオンにします。
  3. いずれかの列名の横にある arrow_drop_down 展開矢印をクリックします。
  4. [2 つの列を結合] を選択し、[カスタム選択] などのオプションを選択します。
  5. JOIN オペレーションの出力の順序、区切り文字、新しい列名を選択します。
  6. [参加] をクリックします。

Wrangler は列を結合し、merge ディレクティブをレシピに追加します。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。

2 つの列名を入れ替える

Wrangler ワークスペースは、2 つの列名の入れ替え(交換)をサポートしています。 列名のみが入れ替わり、列の行の値は変更されません。

2 つの列名を入れ替える手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで、2 つの列名のチェックボックスをオンにします。
  3. いずれかの列名の横にある arrow_drop_down 展開矢印をクリックします。
  4. [2 つの列名を入れ換える] を選択します。

Wrangler は列名を入れ替え、swap ディレクティブをレシピに追加します。

次のステップ