Inspección y ocultamiento de imágenes

Cloud Data Loss Prevention (DLP) puede buscar texto sensible en una imagen y ocultarlo según los criterios que especifiques.

Con los detectores de Infotipo y el reconocimiento óptico de caracteres (OCR), Cloud DLP inspecciona una imagen codificada en base64 en búsqueda de texto y detecta datos sensibles en él. Luego, puede mostrar información sobre la ubicación de los datos sensibles dentro de la imagen o puede enmascararlos con un rectángulo opaco para ocultarlos.

La inspección y el ocultamiento son dos acciones distintas:

  • Inspección: Cloud DLP inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. Muestra los Infotipos detectados, junto con uno o más conjuntos de coordenadas de píxeles y dimensiones. Cada conjunto de valores de coordenadas de píxeles y de dimensiones indican la esquina inferior izquierda y las dimensiones de los cuadros de límite, respectivamente. Cada cuadro de límite corresponde a todo el resultado de Cloud DLP o a una parte de él.
  • Ocultamiento: Cloud DLP inspecciona la imagen enviada codificada en base64 en busca de los Infotipos especificados. Cloud DLP enmascara con rectángulos opacos los resultados de datos sensibles para ocultarlos. Muestra la imagen oculta codificada en base64 en el mismo formato de imagen que la imagen original. También puedes configurar el color de los cuadros de ocultamiento en la solicitud.

Acerca de la inspección

La inspección de imágenes de Cloud DLP toma una imagen codificada en base64, reconoce todo el texto de la imagen y busca los datos que coincidan con sus criterios de inspección. Por último, Cloud DLP muestra las ubicaciones de los datos sensibles que se detectan.

Considera la siguiente imagen. Esta imagen es un ejemplo de un archivo de imagen común generado a partir del escaneo de un documento en papel.

Imagen original sin ocultamiento (haz clic para ampliar)

Si le indicas a Cloud DLP que inspeccione esta imagen en busca de números de identificación personal de EE.UU., pasará por el proceso ilustrado en el siguiente diagrama.

Proceso de inspección de imágenes (haz clic para ampliar)
  1. La imagen codificada en base64 se transmite a Cloud DLP mediante el método content.inspect.
  2. Con el reconocimiento óptico de caracteres (OCR), Cloud DLP reconoce el texto del documento.
  3. Cloud DLP analiza el texto reconocido mediante la configuración de detección de datos sensibles que configuraste antes e identifica coincidencias.
  4. Cloud DLP muestra las coordenadas y dimensiones de las secciones dentro de la imagen en las que encontró datos sensibles según tus criterios de detección.

Las coordenadas que se muestran indican dónde encontrar los datos sensibles. Ten en cuenta que Cloud DLP suele usar varios cuadros para indicar dónde se encuentra una sola instancia de datos sensibles en la imagen. Esto sucede en particular cuando el texto está escrito a mano, como en este ejemplo.

Si Cloud DLP no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra una respuesta HTTP 200 de éxito vacía.

Acerca del ocultamiento

El ocultamiento de imágenes es idéntico a la inspección de imágenes, pero con un paso adicional. Una vez que Cloud DLP identificó las ubicaciones de los datos sensibles dentro de la imagen, en lugar de mostrar las coordenadas de las áreas que contienen los datos, rellena esas áreas en la imagen y muestra una imagen oculta codificada en base64.

Vuelve a fijarte en la imagen original de la sección anterior. Si le indicas a Cloud DLP que oculte todos los números de identificación personal de EE.UU. de la imagen, pasará por el proceso ilustrado en el siguiente diagrama.

Proceso de ocultamiento de imágenes (haz clic para ampliar)
  1. La imagen codificada en base64 se transmite a Cloud DLP mediante el método image.redact.
  2. Con el reconocimiento óptico de caracteres (OCR), Cloud DLP reconoce el texto del documento.
  3. Cloud DLP analiza el texto reconocido mediante la configuración de detección de datos sensibles que configuraste antes e identifica coincidencias.
  4. Cloud DLP cubre todos los datos sensibles con un rectángulo opaco para ocultarlos. Luego, codifica la imagen en base64 y la muestra en la respuesta de la solicitud.

Si Cloud DLP no encuentra ningún dato en la imagen que corresponda a tus criterios de detección, muestra la imagen codificada en base64 sin cambios.

Próximos pasos