本页面介绍了在准备时如何重命名、复制、删除或保留列 存储在 Cloud Data Fusion Studio 的 Wrangler 工作区中。
重命名一个列
要在 Wrangler 工作区重命名列,请点击列名称并输入
新名称。Wrangler 会将 rename
指令添加到该配方中。
复制列
如需了解使用新指令对数据集的影响,您可以将 列复制到具有不同名称的新列中,并在此处应用指令。
如需复制列,请按以下步骤操作:
- 转到 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择复制列,然后为新列输入名称。
Wrangler 会复制该列,并将 copy
指令添加到配方中。
删除列
对于包含许多列的数据集,您可以提高流水线性能并节省 删除不必要的列。列越少,流水线运行完成速度就越快。对于包含 Joiner 转换的流水线,这一点尤为重要。
如需从数据集中删除列,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择删除列。
Wrangler 会删除该列,并将 drop
指令添加到该食谱中。
保留列
您可以在数据集中保留一列,而删除其他所有列。
如需保留某个列,请按以下步骤操作:
- 转到 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择保留列。
Wrangler 会删除数据集中除您选择的列以外的所有列,并将 keep
指令添加到食谱中。
后续步骤
- 详细了解 Wrangler 指令。