设置字符串格式

本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何设置字符串格式。

要设置 String 列的格式,请按以下步骤操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择格式,然后选择一个选项,例如标题大写。以下部分介绍了这些选项。

Wrangler 会在预览模式下对列的值执行转换,并将相应的指令添加到食谱中。运行数据流水线时,系统会将转换应用于该列中的所有值。

更改字符串的大小写

如需更改字母大小写,请按照上一部分中的步骤操作,然后选择以下选项之一。

选项 说明
大写 将字符串的字母大小写更改为全部大写,例如 1800 Amphibious Blvd.更改为 1800 AMPHIBIOUS BLVD.
小写 将字符串的字母大小写更改为全小写,例如,1800 Amphibious Blvd. 更改为 1800 amphibious blvd.
TitleCase 将字母大小写更改为将每个字词的第一个字母大写,例如 1800 amphibious blvd. 更改为 1800 Amphibious Blvd.

串联字符串

要将字符附加到某列中所有字符串值的开头或结尾,请执行以下操作: 请按以下步骤操作:

  1. 转到 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 依次点击格式 > 串联
  4. Add(添加)字段中,输入要添加到现有值的字符串。
  5. 选择要在字符串中的什么位置添加新值,方法是在 开始在结束
  6. 可选:如需为串联的字符串创建新列,请选中复制到新列复选框。

示例

以下示例显示了将字符串 NEW- 添加到 列中每个值的开头:

输入 输出
bread NEW-bread
butter NEW-butter

从字符串中剪除空格

如需删除空格,请按照本页开头部分中用于设置字符串列格式的步骤操作,然后选择以下选项之一:

选项 说明
去除多余空格 移除尾随和前导空格 (trim)。
去除前导空格 移除前导空格 (ltrim)。
去除尾随空格 移除尾随空格 (rtrim)。

后续步骤