Inspección y ocultamiento de imágenes

Sensitive Data Protection puede buscar texto sensible en una imagen y ocultarlo según los criterios que especifiques.

Con los detectores de Infotipo y el reconocimiento óptico de caracteres (OCR), Sensitive Data Protection inspecciona una imagen codificada en base64 en busca de texto y detecta datos sensibles en él. Luego, puede mostrar información sobre la ubicación de los datos sensibles dentro de la imagen o puede enmascararlos con un rectángulo opaco para ocultarlos.

La inspección y el ocultamiento son dos acciones distintas:

  • Inspección: La Protección de datos sensibles inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. Muestra los Infotipos detectados, junto con uno o más conjuntos de coordenadas de píxeles y dimensiones. Cada conjunto de valores de coordenadas de píxeles y de dimensiones indican la esquina inferior izquierda y las dimensiones de los cuadros de límite, respectivamente. Cada cuadro de límite corresponde a todo el resultado de la Protección de datos sensibles o a una parte de él.
  • Ocultamiento: La Protección de datos sensibles inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. La Protección de datos sensibles enmascara con rectángulos opacos los resultados de datos sensibles para ocultarlos. Muestra la imagen oculta codificada en base64 en el mismo formato de imagen que la imagen original. También puedes configurar el color de los cuadros de ocultamiento en la solicitud.

Acerca de la inspección

La inspección de imágenes de la Protección de datos sensibles toma una imagen codificada en base64, reconoce todo el texto de la imagen y busca los datos que coincidan con sus criterios de inspección. Por último, la Protección de datos sensibles muestra las ubicaciones de los datos sensibles que se detectan.

Considera la siguiente imagen. Esta imagen es un ejemplo de un archivo de imagen común generado a partir del escaneo de un documento en papel.

Imagen original sin ocultamiento.
Imagen original sin ocultamiento (haz clic para ampliar).

Si le indicas a la Protección de datos sensibles que inspeccione esta imagen en busca de números de identificación personal de EE.UU., pasará por el proceso ilustrado en el siguiente diagrama.

Proceso de inspección de imágenes.
Proceso de inspección de imágenes (haz clic para ampliar).
  1. La imagen codificada en base64 se transmite a la Protección de datos sensibles con el método content.inspect.
  2. Con el reconocimiento óptico de caracteres (OCR), la Protección de datos sensibles reconoce el texto del documento.
  3. La Protección de datos sensibles analiza el texto reconocido mediante la configuración de detección de datos sensibles que configuraste antes e identifica coincidencias.
  4. La protección de datos sensibles muestra las coordenadas y dimensiones de las regiones dentro de la imagen en las que encontró datos sensibles según tus criterios de detección.

Las coordenadas que se muestran indican dónde encontrar los datos sensibles. Ten en cuenta que Sensitive Data Protection suele usar varios cuadros para indicar dónde se encuentra una sola instancia de datos sensibles en la imagen. Esto sucede en particular cuando el texto está escrito a mano, como en este ejemplo.

Si la Protección de datos sensibles no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra una respuesta HTTP 200 de éxito vacía.

Acerca del ocultamiento

El ocultamiento de imágenes es idéntico a la inspección de imágenes, pero con un paso adicional. Una vez que la Protección de datos sensibles identificó las ubicaciones de los datos sensibles dentro de la imagen, en lugar de mostrar las coordenadas de las áreas que contienen los datos, rellena esas áreas en la imagen y muestra una imagen oculta codificada en base64.

Vuelve a fijarte en la imagen original de la sección anterior. Si le indicas a la Protección de datos sensibles que oculte todos los números de identificación personal de EE.UU. de la imagen, pasará por el proceso ilustrado en el siguiente diagrama.

Proceso de ocultamiento de imágenes.
Proceso de ocultamiento de imágenes (haz clic para ampliar).
  1. La imagen codificada en base64 se transmite a la Protección de datos sensibles con el método image.redact.
  2. Con el reconocimiento óptico de caracteres (OCR), la Protección de datos sensibles reconoce el texto del documento.
  3. La Protección de datos sensibles analiza el texto reconocido mediante la configuración de detección de datos sensibles que configuraste antes e identifica coincidencias.
  4. La Protección de datos sensibles cubre todos los datos sensibles detectados con un rectángulo opaco para ocultarlos. Luego, codifica la imagen en base64 y la muestra en la respuesta de la solicitud.

Si la Protección de datos sensibles no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra la imagen codificada en base64 sin cambios.

¿Qué sigue?