联接并交换两列

本页介绍了如何在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时联接列值和交换列名称。

联接两列

Wrangler 工作区支持联接相同或不同的两列 数据类型。JOIN 运算的输出会存储在新列中,其中包含这两个列中的联接字段。Wrangler 不支持联接 其他列包含布尔值和字节数据类型。

如需联接两个列,请按以下步骤操作:

  1. 转到 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,选中两个列名称旁边的复选框。
  3. 点击某个列名称旁边的 arrow_drop_down 展开箭头。
  4. 选择联接两列,然后选择所需选项,例如自定义 选择
  5. JOIN 操作选择顺序、分隔符和新列名称 输出。
  6. 点击加入

Wrangler 会联接列并将 merge 指令添加到配方中。时间 该转换将应用于数据流水线中的所有值, 列。

替换两个列名称

Wrangler 工作区支持交换(或交换)两个列名称。 只有列名称会互换,列行中的值不会更改。

如需交换两个列名称,请按以下步骤操作:

  1. 转到 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,选中两个列名称旁边的复选框。
  3. 点击 arrow_drop_down 加号任一列名的展开箭头。
  4. 选择交换两个列名称

Wrangler 会交换列名称并将 swap 指令添加到配方中。

后续步骤