图片检查和隐去

Sensitive Data Protection 可以检查和隐去图片中的敏感文本 执行指定的操作

使用 infoType 检测器和光学字符 识别 (OCR)、敏感数据保护服务 使用 base64 编码的文本图片,可检测敏感数据 。然后返回有关图片内敏感数据位置的信息,或使用不透明的矩形遮盖发现的敏感数据,将其隐去。

检查和隐去是两项不同的操作:

  • 检查:敏感数据保护功能会检查所提交的 base64 编码的图片中是否存在指定的 infoType。它会返回检测到的 InfoType,以及一组或多组像素坐标和维度。 每组像素坐标和维度值分别表示边界框的左下角和维度。每个边界框对应全部或部分的敏感数据保护发现结果。
  • 隐去:敏感数据保护功能会检查所提交的 base64 编码的图片中是否存在指定的 infoType。敏感数据保护功能会使用不透明的矩形遮盖发现的所有敏感数据以将其隐去。它会返回隐去了敏感数据的 base64 编码的图片,采用与原始图片相同的格式。您还可以在请求中配置隐去框的颜色。

检查简介

敏感数据保护功能的图片检查功能会检查所提交的 base64 编码的图片,识别图片中的任何文本,然后在文本中搜索匹配其检查条件的任何数据。最后,Sensitive Data Protection 会返回其检测到的所有敏感数据的位置。

请参考以下图片。此图片是通过扫描纸质文档生成的典型图片文件示例。

未经隐去处理的原始图片。
未遮盖的原始图片(点击可放大)。

如果您指示 Sensitive Data Protection 检查此图片中是否存在美国社交媒体用户 安全号码,其流程如下所示 图表。

图片检查流程。
图片检查流程(点击可放大)。
  1. 使用 content.inspect 方法将 base64 编码的图片流式传输到敏感数据保护。
  2. 敏感数据保护功能通过使用光学字符识别 (OCR) 识别文档中的文本。
  3. Sensitive Data Protection 使用 敏感数据检测配置,用于识别 任何匹配项。
  4. Sensitive Data Protection 会返回根据检测标准找到的图片中敏感数据的位置坐标和维度。

返回的坐标指示找到敏感数据的位置。请注意,Sensitive Data Protection 通常使用多个框来指示图片内单个敏感数据实例的位置。对于手写文本尤其如此,如本例所示。

如果 Sensitive Data Protection 在图片中找不到任何数据 符合检测条件,则会返回成功的空 HTTP 200 响应。

遮盖简介

图片隐去比图片检查多了一个步骤。一次 Sensitive Data Protection 已识别以下服务中包含敏感数据的位置: 而不是返回包含 它会填充图片上的这些区域,返回隐去数据、base64 编码的 图片。

再次参考上一部分中的原始图片。如果您指示敏感数据保护功能隐去图片中的所有美国社会保障号,它将执行下图所示的流程。

图片隐去流程。
图片隐去流程(点击可放大)。
  1. 使用 image.redact 方法将 base64 编码的图片流式传输到敏感数据保护。
  2. 敏感数据保护功能通过使用光学字符识别 (OCR) 识别文档中的文本。
  3. Sensitive Data Protection 使用您之前设置的敏感数据检测配置扫描识别出的文本,识别出所有匹配项。
  4. Sensitive Data Protection 通过以下方式隐去检测到的所有敏感数据: 并用不透明的矩形覆盖它然后对图片进行 base64 编码并在请求响应中返回。

如果 Sensitive Data Protection 未在图片中找到与您的检测标准相匹配的任何数据,则会返回 base64 编码的相同图片。

后续步骤