Clasificación, ocultamiento y desidentificación

La Protección de datos sensibles te ayuda a comprender, administrar y proteger los datos sensibles. Con la Protección de datos sensibles, puedes clasificar y ocultar con facilidad los datos sensibles que se encuentran en imágenes y contenido basados en texto, incluido el contenido almacenado en repositorios de almacenamiento de Google Cloud.

Clasificación de texto

Dada la siguiente entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Se muestra una lista de resultados organizada en las siguientes categorías:

  • InfoType
  • Likelihood
  • Offset (en qué parte de la string se encontró el InfoType potencial)

En la siguiente tabla, se muestra un resultado de ejemplo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Ocultamiento automático de texto

El ocultamiento automático produce un resultado con las coincidencias de datos sensibles ya quitadas en lugar de darte una lista de hallazgos.

Ejemplo de entrada de ocultamiento automático:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Resultado de ejemplo con un marcador de posición “***”:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Clasificación de imágenes

La protección de datos sensibles usa la tecnología de reconocimiento óptico de caracteres (OCR) para reconocer el texto antes de la clasificación. Es similar a la clasificación de texto ya que muestra los hallazgos, pero también agrega un cuadro delimitador donde se encontró el texto.

Clasificación de almacenamiento

La clasificación de almacenamiento analiza los datos almacenados en Cloud Storage, Firestore en modo Datastore (Datastore) y BigQuery. En lugar de transmitir datos a la protección de datos sensibles, debes especificar en tu solicitud la ubicación de almacenamiento para el bucket de Cloud Storage, el tipo de Datastore o la tabla de BigQuery que quieres que analice la protección de datos sensibles.

Cuando se analizan archivos en ubicaciones de Cloud Storage, la protección de datos sensibles admite el análisis de archivos binarios, de texto, de imágenes, de Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF y Apache Avro. En la página de referencia de la API de FileType, encontrarás una lista de extensiones de archivo para los tipos de archivos dentro de Cloud Storage que la protección de datos sensibles puede analizar. Los tipos de archivos que no se reconocen se analizan como archivos binarios.

Los resultados del análisis pueden guardarse en una tabla de BigQuery nueva o publicarse en un tema de Pub/Sub. Desde allí, puedes usar herramientas integradas de BigQuery para ejecutar estadísticas enriquecidas de SQL o herramientas como Looker Studio para generar informes.

Para obtener más información sobre el análisis de repositorios de almacenamiento en busca de datos sensibles mediante la protección de datos sensibles, consulta Inspecciona el almacenamiento y las bases de datos en busca de datos sensibles.

Si deseas obtener más información para visualizar los resultados del análisis con otras herramientas de Google Cloud, consulta Analiza los resultados de la protección de datos sensibles y genera informes sobre ellos.

¿Qué sigue?