掩盖数据

本页介绍了在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据时如何遮盖敏感数据。您可以对任何数据类型(布尔值和字节类型除外)的列中的数据进行脱敏处理。

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 选择遮罩,然后选择一个选项,例如自定义选择。以下部分介绍了这些选项。

系统会将转换应用于 Wrangler 工作区的“数据”标签页上显示的预览数据。Wrangler 会向该配方添加遮罩指令。运行数据流水线时,系统会将转换应用于该列中的所有值。

仅显示后四个字符

仅显示最后 4 个字符脱敏选项会将 mask-number 指令添加为配方的转换步骤。

仅显示最后两位字符

仅显示最后 2 个字符蒙版选项会将 mask-number 指令添加为转换步骤到该食谱。

自定义选择

借助自定义选择蒙版选项,您可以选择要掩盖的单元格中的字符位置,并掩盖该列中每行中处于相似位置的字符。例如,在包含 10 个字符的字符串的单元格中,选择字符串的前 8 个字符会导致该列的每一行中的前 8 个字符被遮盖。

如需选择要遮盖的特定字符,请执行以下操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作区
  2. 数据标签页中,找到列名称,然后点击 arrow_drop_down 展开箭头。
  3. 依次选择遮盖 > 自定义选择。可被蒙版的列值的背景为蓝色。
  4. 在该列的任意单元格中,选择要隐去显示的字符。
  5. 点击应用

列中的所有字段的该部分值都会被遮盖。

“自定义选择”会将 mask-number 指令添加到食谱中。运行数据流水线时,系统会将转换应用于该列中的所有值。

通过随机播放

“按洗牌方式”遮盖选项会对列中的每个字段应用随机遮盖模式。Wrangler 会将 mask-shuffle 指令作为转换步骤添加到配方中。

后续步骤