Clasificación, ocultamiento y desidentificación

Sensitive Data Protection te ayuda a comprender, administrar y proteger los datos sensibles. Con la Protección de datos sensibles, puedes clasificar y ocultar con facilidad los datos sensibles que se encuentran en las imágenes y el contenido basado en texto, incluido el contenido de los repositorios de almacenamiento de Google Cloud.

Clasificación de texto

Dada la siguiente entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Se muestra una lista de resultados organizada en las siguientes categorías:

  • InfoType
  • Likelihood
  • Offset (en qué parte de la string se encontró el InfoType potencial)

En la siguiente tabla, se muestra un resultado de ejemplo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Ocultamiento automático de texto

El ocultamiento automático produce un resultado con las coincidencias de datos sensibles ya quitadas en lugar de darte una lista de hallazgos.

Ejemplo de entrada de ocultamiento automático:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Resultado de ejemplo con un marcador de posición “***”:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Clasificación de imágenes

La Protección de datos sensibles usa la tecnología de reconocimiento óptico de caracteres (OCR) para reconocer el texto antes de la clasificación. Es similar a la clasificación de texto ya que muestra los hallazgos, pero también agrega un cuadro delimitador donde se encontró el texto.

Clasificación de almacenamiento

La clasificación de almacenamiento analiza los datos almacenados en Cloud Storage, Firestore en modo Datastore (Datastore) y BigQuery. En lugar de transmitir datos a Sensitive Data Protection, debes especificar en tu solicitud la ubicación de almacenamiento del bucket de Cloud Storage, el tipo de Datastore o la tabla de BigQuery que deseas analizar con Sensitive Data Protection.

Cuando se analizan archivos en ubicaciones de Cloud Storage, la Protección de datos sensibles admite el análisis de archivos de objetos binarios, de texto, de imagen, de Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF y Apache Avro. En la página de referencia de la API de FileType, se encuentra disponible una lista de extensiones de archivo de los tipos de archivos dentro de Cloud Storage que Sensitive Data Protection puede analizar. Los tipos de archivos que no se reconocen se analizan como archivos binarios.

Los resultados del análisis pueden guardarse en una tabla de BigQuery nueva o publicarse en un tema de Pub/Sub. Desde allí, puedes usar las herramientas integradas de BigQuery para ejecutar estadísticas enriquecidas de SQL o herramientas como Looker Studio para generar informes.

Para obtener más información sobre el análisis de repositorios de almacenamiento en busca de datos sensibles con Sensitive Data Protection, consulta Inspecciona el almacenamiento y las bases de datos en busca de datos sensibles.

Para obtener más información sobre cómo visualizar los resultados del análisis con otras herramientas de Google Cloud, consulta Analiza y genera informes con los resultados de la Protección de datos sensibles.

¿Qué sigue?