本页介绍了如何在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时联接列值和交换列名称。
联接两列
Wrangler 工作区支持联接相同或不同的两列
数据类型。JOIN
运算的输出会存储在新列中,其中包含这两个列中的联接字段。Wrangler 不支持联接
其他列包含布尔值和字节数据类型。
如需联接两个列,请按以下步骤操作:
- 转到 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,选中两个列名称旁边的复选框。
- 点击某个列名称旁边的 arrow_drop_down 展开箭头。
- 选择联接两列,然后选择所需选项,例如自定义 选择。
- 为
JOIN
操作选择顺序、分隔符和新列名称 输出。 - 点击加入。
Wrangler 会联接列并将 merge
指令添加到配方中。时间
该转换将应用于数据流水线中的所有值,
列。
替换两个列名称
Wrangler 工作区支持交换(或交换)两个列名称。 只有列名称会互换,列行中的值不会更改。
如需交换两个列名称,请按以下步骤操作:
- 转到 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,选中两个列名称旁边的复选框。
- 点击 arrow_drop_down 加号任一列名的展开箭头。
- 选择交换两个列名称
Wrangler 会交换列名称并将 swap
指令添加到配方中。
后续步骤
- 详细了解 Wrangler 指令。