Clasificación, ocultamiento y desidentificación

Cloud Data Loss Prevention (DLP) te ayuda a comprender, administrar y proteger los datos sensibles. Con Cloud DLP, puedes clasificar y ocultar con facilidad los datos sensibles que se encuentran en las imágenes y el contenido basado en texto, incluido el contenido de los repositorios de almacenamiento de Google Cloud.

Clasificación de texto

Dada la siguiente entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Se muestra una lista de resultados organizada en las siguientes categorías:

  • InfoType
  • Likelihood
  • Offset (en qué parte de la string se encontró el InfoType potencial)

En la siguiente tabla, se muestra un resultado de ejemplo.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Ocultamiento automático de texto

El ocultamiento automático produce un resultado con las coincidencias de datos sensibles ya quitadas en lugar de darte una lista de hallazgos.

Ejemplo de entrada de ocultamiento automático:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Resultado de ejemplo con un marcador de posición “***”:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Clasificación de imágenes

Cloud DLP usa la tecnología de reconocimiento óptico de caracteres (OCR) para reconocer el texto antes de la clasificación. Es similar a la clasificación de texto ya que muestra los hallazgos, pero también agrega un cuadro delimitador donde se encontró el texto.

Clasificación de almacenamiento

La clasificación de almacenamiento analiza los datos almacenados en Cloud Storage, Datastore y BigQuery. En lugar de transmitir datos a Cloud DLP, debes especificar en tu solicitud la ubicación de almacenamiento del depósito de Cloud Storage, el tipo de Datastore o la tabla de BigQuery que deseas analizar con Cloud DLP.

Cuando se analizan archivos en ubicaciones de Cloud Storage, Cloud DLP admite el análisis de archivos de objetos binarios, de texto, de imagen, de Microsoft Word, PDF y Apache Avro. En la página de referencia de la API de FileType, se encuentra disponible una lista de extensiones de archivo de los tipos de archivos dentro de Cloud Storage que Cloud DLP puede analizar. Los tipos de archivos que no se reconocen se analizan como archivos binarios.

Los resultados del análisis pueden guardarse en una tabla de BigQuery nueva o publicarse en un tema de Pub/Sub. Desde allí, puedes usar las herramientas integradas de BigQuery a fin de ejecutar estadísticas enriquecidas de SQL o herramientas como Google Data Studio para generar informes.

Para obtener más información sobre el análisis de repositorios de almacenamiento en busca de datos sensibles mediante Cloud DLP, consulta Inspecciona el almacenamiento y las bases de datos en busca de datos sensibles.

Para obtener más información sobre cómo visualizar los resultados del análisis con otras herramientas de Google Cloud, consulta Analiza y genera informes con los resultados del análisis de Cloud DLP.