本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何重命名、复制、删除或保留列。
重命名一个列
如需在 Wrangler 工作区中重命名列,请点击列名称,然后输入新名称。Wrangler 会将 rename
指令添加到该配方中。
复制列
如需了解使用新指令对数据集的影响,您可以将某个列复制到具有不同名称的新列中,然后在该新列中应用指令。
如需复制列,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择复制列,然后为新列输入名称。
Wrangler 会复制该列,并将 copy
指令添加到配方中。
删除列
对于包含许多列的数据集,您可以通过删除不必要的列来提高流水线性能并节省资源。列越少,流水线运行完成速度就越快。对于包含 Joiner 转换的流水线,这一点尤为重要。
如需从数据集中删除列,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择删除列。
Wrangler 会删除该列,并将 drop
指令添加到该食谱中。
保留列
您可以保留数据集中的某个列,并删除所有其他列。
如需保留某个列,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择保留列。
Wrangler 会删除数据集中除您选择的列以外的所有列,并将 keep
指令添加到食谱中。
后续步骤
- 详细了解 Wrangler 指令。