重命名、复制、删除或保留列

本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何重命名、复制、删除或保留列。

重命名一个列

如需在 Wrangler 工作区中重命名列,请点击列名称,然后输入新名称。Wrangler 会将 rename 指令添加到该配方中。

复制列

如需了解使用新指令对数据集的影响,您可以将某个列复制到具有不同名称的新列中,然后在该新列中应用指令。

如需复制列,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择复制列,然后为新列输入名称。

Wrangler 会复制该列,并将 copy 指令添加到配方中。

删除列

对于包含许多列的数据集,您可以通过删除不必要的列来提高流水线性能并节省资源。列越少,流水线运行完成速度就越快。对于包含 Joiner 转换的流水线,这一点尤为重要。

如需从数据集中删除列,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择删除列

Wrangler 会删除该列,并将 drop 指令添加到该食谱中。

保留列

您可以保留数据集中的某个列,并删除所有其他列。

如需保留某个列,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择保留列

Wrangler 会删除数据集中除您选择的列以外的所有列,并将 keep 指令添加到食谱中。

后续步骤