本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何联接列值和交换列名称。
联接两列
Wrangler 工作区支持联接数据类型相同或不同的两个列。JOIN
运算的输出会存储在新列中,其中包含这两个列中的联接字段。Wrangler 不支持将布尔值和字节数据类型的列与其他列联接。
如需联接两个列,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,按两列名称选择复选框。
- 点击某个列名称旁边的 arrow_drop_down 展开箭头。
- 选择联接两个列,然后选择一个选项,例如自定义选择。
- 为
JOIN
运算的输出选择排序、分隔符和新列名称。 - 点击加入。
Wrangler 会联接这些列,并将 merge
指令添加到该配方中。运行数据流水线时,系统会将转换应用于该列中的所有值。
交换两个列名称
Wrangler 工作区支持交换(或互换)两个列名称。只有列名称会互换,列行中的值不会更改。
如需交换两个列名称,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,按两列名称选择复选框。
- 点击某个列名称旁边的 arrow_drop_down 展开箭头。
- 选择交换两个列名称
Wrangler 会交换列名称,并将 swap
指令添加到食谱中。
后续步骤
- 详细了解 Wrangler 指令。