Clasificación, ocultamiento y desidentificación

Protección de Datos Sensibles te ayuda a identificar, gestionar y proteger los datos sensibles. Con Protección de Datos Sensibles, puedes clasificar y ocultar fácilmente los datos sensibles que se encuentran en contenido basado en texto e imágenes, incluido el contenido almacenado enGoogle Cloud repositorios de almacenamiento.

Clasificación de textos

Dada la siguiente entrada de texto:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

El resultado es una lista de hallazgos, organizada en las siguientes categorías:

En la tabla de abajo se muestra un ejemplo de resultado.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Ocultación automática de texto

La redacción automática genera un resultado con las coincidencias de datos sensibles eliminadas en lugar de proporcionarte una lista de resultados.

Ejemplo de entrada de ocultación de automatización:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Ejemplo de resultado con el marcador de posición "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Clasificación de imágenes

Sensitive Data Protection usa la tecnología de reconocimiento óptico de caracteres (OCR) para reconocer el texto antes de clasificarlo. Al igual que la clasificación de texto, devuelve resultados, pero también añade un cuadro de delimitación en el que se ha encontrado el texto.

Clasificación del almacenamiento

Los análisis de clasificación de almacenamiento analizan los datos almacenados en Cloud Storage, Firestore en el modo de Datastore (Datastore) y BigQuery. En lugar de transmitir datos a Protección de Datos Sensibles, especifica en tu solicitud la ubicación de almacenamiento del segmento de Cloud Storage, el tipo de Datastore o la tabla de BigQuery que quieres que analice Protección de Datos Sensibles.

Al analizar archivos en ubicaciones de Cloud Storage, Protección de Datos Sensibles admite el análisis de archivos binarios, de texto, de imagen, de Microsoft Word, de Microsoft Excel, de Microsoft PowerPoint, PDF y Apache Avro. En la página de referencia de la API de FileType se incluye una lista de extensiones de archivo de los tipos de archivo de Cloud Storage que puede analizar Protección de Datos Sensibles. Los archivos de tipos no reconocidos se analizan como archivos binarios.

Los resultados del análisis se pueden guardar en una tabla de BigQuery o publicar en un tema de Pub/Sub. Desde ahí, puedes usar herramientas de BigQuery integradas para ejecutar analíticas SQL avanzadas o herramientas como Looker Studio para generar informes.

Para obtener más información sobre cómo analizar repositorios de almacenamiento en busca de datos sensibles con Protección de Datos Sensibles, consulta Buscar datos sensibles en el almacenamiento y las bases de datos.

Para obtener más información sobre cómo visualizar los resultados de los análisis con otras herramientas, consulta el artículo Analizar y generar informes sobre los resultados de la protección de datos sensibles. Google Cloud

Siguientes pasos