重命名、复制、删除或保留列

本页面介绍了在准备时如何重命名、复制、删除或保留列 存储在 Cloud Data Fusion Studio 的 Wrangler 工作区中。

重命名一个列

要在 Wrangler 工作区重命名列,请点击列名称并输入 新名称。Wrangler 会将 rename 指令添加到该配方中。

复制列

如需了解使用新指令对数据集的影响,您可以将 列复制到具有不同名称的新列中,并在此处应用指令。

如需复制列,请按以下步骤操作:

  1. 转到 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择复制列,然后为新列输入名称。

Wrangler 会复制该列,并将 copy 指令添加到配方中。

删除列

对于包含许多列的数据集,您可以提高流水线性能并节省 删除不必要的列。列越少,流水线运行完成速度就越快。对于包含 Joiner 转换的流水线,这一点尤为重要。

如需从数据集中删除列,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择删除列

Wrangler 会删除该列,并将 drop 指令添加到该食谱中。

保留列

您可以在数据集中保留一列,而删除其他所有列。

如需保留某个列,请按以下步骤操作:

  1. 转到 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择保留列

Wrangler 会删除数据集中除您选择的列以外的所有列,并将 keep 指令添加到食谱中。

后续步骤