Inspección y ocultamiento de imágenes

La protección de datos sensibles puede inspeccionar y ocultar el texto sensible de una imagen según los criterios que especifiques.

Con los detectores de Infotipo y el reconocimiento óptico de caracteres (OCR), la protección de datos sensibles inspecciona una imagen codificada en base64 en busca de texto y detecta datos sensibles dentro del texto. Luego, puede mostrar información sobre la ubicación de los datos sensibles dentro de la imagen o puede enmascararlos con un rectángulo opaco para ocultarlos.

La inspección y el ocultamiento son dos acciones distintas:

  • Inspección: La protección de datos sensibles inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. Muestra los Infotipos detectados, junto con uno o más conjuntos de coordenadas de píxeles y dimensiones. Cada conjunto de valores de coordenadas de píxeles y de dimensiones indican la esquina inferior izquierda y las dimensiones de los cuadros de límite, respectivamente. Cada cuadro de límite corresponde a la totalidad o parte de un resultado de la protección de datos sensibles.
  • Ocultamiento: La protección de datos sensibles inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. La protección de datos sensibles oculta los hallazgos de datos sensibles mediante el enmascaramiento de rectángulos opacos. Muestra la imagen oculta codificada en base64 en el mismo formato de imagen que la imagen original. También puedes configurar el color de los cuadros de ocultamiento en la solicitud.

Acerca de la inspección

La inspección de imágenes de la protección de datos sensibles toma una imagen codificada en base64, reconoce cualquier texto en la imagen y, luego, busca en el texto cualquier dato que coincida con sus criterios de inspección. Por último, la protección de datos sensibles muestra las ubicaciones de los datos sensibles que detecta.

Considera la siguiente imagen. Esta imagen es un ejemplo de un archivo de imagen común generado a partir del escaneo de un documento en papel.

Imagen original sin ocultar.
Imagen original sin ocultar (haz clic para ampliar).

Si le indicas a la Protección de datos sensibles que inspeccione esta imagen en busca de números de seguridad social de EE.UU., se ejecutará el proceso que se ilustra en el siguiente diagrama.

Proceso de inspección de imágenes
Proceso de inspección de imágenes (haz clic para ampliar).
  1. La imagen codificada en base64 se transmite a la protección de datos sensibles mediante el método content.inspect.
  2. Con el reconocimiento óptico de caracteres (OCR), la protección de datos sensibles reconoce texto en el documento.
  3. La protección de datos sensibles analiza el texto reconocido mediante la configuración de detección de datos sensibles que estableciste antes y, luego, identifica cualquier coincidencia.
  4. La protección de datos sensibles muestra las coordenadas y las dimensiones de las regiones dentro de la imagen en las que encontró datos sensibles según tus criterios de detección.

Las coordenadas que se muestran indican dónde encontrar los datos sensibles. Ten en cuenta que la protección de datos sensibles suele usar varios cuadros para indicar dónde se encuentra una sola instancia de datos sensibles en la imagen. Esto sucede en particular cuando el texto está escrito a mano, como en este ejemplo.

Si la protección de datos sensibles no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra una respuesta HTTP 200 correcta vacía.

Acerca del ocultamiento

El ocultamiento de imágenes es idéntico a la inspección de imágenes, pero con un paso adicional. Una vez que la protección de datos sensibles identifica las ubicaciones de los datos sensibles dentro de la imagen, en lugar de mostrar las coordenadas de las áreas que contienen los datos, llena esas áreas en la imagen y muestra una imagen oculta codificada en base64.

Vuelve a fijarte en la imagen original de la sección anterior. Si le indicas a la Protección de datos sensibles que oculte todos los números de seguridad social de EE.UU. de la imagen, se realiza el proceso que se ilustra en el siguiente diagrama.

Proceso de ocultamiento de imágenes
Proceso de ocultamiento de imágenes (haz clic para ampliar).
  1. La imagen codificada en base64 se transmite a la protección de datos sensibles mediante el método image.redact.
  2. Con el reconocimiento óptico de caracteres (OCR), la protección de datos sensibles reconoce texto en el documento.
  3. La protección de datos sensibles analiza el texto reconocido mediante la configuración de detección de datos sensibles que estableciste antes y, luego, identifica cualquier coincidencia.
  4. La protección de datos sensibles oculta todos los datos sensibles detectados mediante la cubierta de un rectángulo opaco. Luego, codifica la imagen en base64 y la muestra en la respuesta de la solicitud.

Si la protección de datos sensibles no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra la imagen codificada en base64 sin cambios.

¿Qué sigue?