本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何设置字符串格式。
要设置 String 列的格式,请按以下步骤操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页上,转到列名称,然后点击 arrow_drop_down 展开箭头。
- 选择格式,然后选择一个选项,例如标题大写。以下部分介绍了这些选项。
Wrangler 会在预览模式下对列的值执行转换,并将相应的指令添加到食谱中。运行数据流水线时,系统会将转换应用于该列中的所有值。
更改字符串的大小写
如需更改字母大小写,请按照上一部分中的步骤操作,然后选择以下选项之一。
选项 | 说明 |
---|---|
大写 | 将字符串的字母大小写更改为全部大写,例如
1800 Amphibious Blvd. 更改为
1800 AMPHIBIOUS BLVD. |
小写 | 将字符串的字母大小写更改为全小写,例如,1800 Amphibious Blvd. 更改为 1800 amphibious blvd. |
TitleCase | 将字母大小写更改为将每个字词的第一个字母大写,例如 1800 amphibious blvd. 更改为 1800 Amphibious Blvd. |
串联字符串
要将字符附加到某列中所有字符串值的开头或结尾,请执行以下操作: 请按以下步骤操作:
- 转到 Cloud Data Fusion 中的 Wrangler 工作区。
- 在数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
- 依次点击格式 > 串联。
- 在 Add(添加)字段中,输入要添加到现有值的字符串。
- 选择要在字符串中的什么位置添加新值,方法是在 开始或在结束。
- 可选:如需为串联的字符串创建新列,请选中复制到新列复选框。
示例
以下示例显示了将字符串 NEW-
添加到
列中每个值的开头:
输入 | 输出 |
---|---|
bread |
NEW-bread |
butter |
NEW-butter |
从字符串中剪除空格
如需删除空格,请按照本页开头部分中用于设置字符串列格式的步骤操作,然后选择以下选项之一:
选项 | 说明 |
---|---|
去除多余空格 | 移除尾随和前导空格 (trim )。 |
去除前导空格 | 移除前导空格 (ltrim )。 |
去除尾随空格 | 移除尾随空格 (rtrim )。 |
后续步骤
- 详细了解 Wrangler 指令。