联接和交换两列

本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何联接列值和交换列名称。

联接两列

Wrangler 工作区支持联接数据类型相同或不同的两个列。JOIN 运算的输出会存储在新列中,其中包含这两个列中的联接字段。Wrangler 不支持将布尔值和字节数据类型的列与其他列联接。

如需联接两个列,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,按两列名称选择复选框。
  3. 点击某个列名称旁边的 arrow_drop_down 展开箭头。
  4. 选择联接两个列,然后选择一个选项,例如自定义选择
  5. JOIN 运算的输出选择排序、分隔符和新列名称。
  6. 点击加入

Wrangler 会联接这些列,并将 merge 指令添加到该配方中。运行数据流水线时,系统会将转换应用于该列中的所有值。

交换两个列名称

Wrangler 工作区支持交换(或互换)两个列名称。只有列名称会互换,列行中的值不会更改。

如需交换两个列名称,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,按两列名称选择复选框。
  3. 点击某个列名称旁边的 arrow_drop_down 展开箭头。
  4. 选择交换两个列名称

Wrangler 会交换列名称,并将 swap 指令添加到食谱中。

后续步骤