Classification, masquage et anonymisation

Sensitive Data Protection vous aide à comprendre, gérer et protéger les données sensibles. Avec la protection des données sensibles, vous pouvez facilement classifier et masquer les données sensibles apparaissant dans des contenus de type texte et dans des images, y compris des contenus stockés dans des dépôts Google Cloud Storage.

Classification de texte

Examinez l'entrée de texte suivante :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Nous obtenons une liste de résultats organisés dans les catégories suivantes :

  • InfoType
  • Likelihood
  • Offset (l'emplacement de la chaîne où la valeur InfoType potentielle a été trouvée)

Des exemples de résultats sont indiqués dans le tableau ci-dessous.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Masquage automatique de texte

Plutôt que de vous présenter une liste de résultats, le masquage automatique génère un résultat duquel sont effacées les correspondances de données sensibles.

Exemple d'entrée avec masquage automatique :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemple de résultat utilisant un espace réservé "***" :

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classification d'images

La protection des données sensibles identifie du texte à l'aide de la technologie de reconnaissance optique des caractères (OCR) avant de le classifier. Comme pour la classification de texte, il renvoie les résultats, mais ajoute également un cadre de délimitation là où le texte a été trouvé.

Classification du stockage

La classification du stockage analyse les données stockées dans Cloud Storage, Firestore en mode Datastore (Datastore) et BigQuery. Au lieu de diffuser les données dans la protection des données sensibles, vous spécifiez dans votre requête l'emplacement de stockage du bucket Cloud Storage, du genre Datastore ou de la table BigQuery que vous souhaitez faire analyser par la protection des données sensibles.

Lors de l'analyse de fichiers dans des emplacements Cloud Storage, la protection des données sensibles est compatible avec l'analyse de fichiers binaires, texte, image, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF et Apache Avro. Une liste des extensions de fichiers pour les types de fichiers Cloud Storage pouvant être analysés par la protection des données sensibles est disponible sur la page de référence de l'API pour FileType. Les fichiers de types non reconnus sont analysés en tant que fichiers binaires.

Les résultats de l'analyse peuvent être enregistrés dans une nouvelle table BigQuery ou publiés dans un sujet Pub/Sub. Vous pouvez alors vous servir des outils BigQuery intégrés pour générer des analyses SQL approfondies ou des outils tels que Looker Studio pour générer des rapports.

Pour en savoir plus sur l'analyse de données sensibles dans les dépôts de stockage à l'aide de la protection des données sensibles, consultez la page Inspecter le stockage et les bases de données pour identifier les données sensibles.

Pour en savoir plus sur la visualisation des résultats d'analyse à l'aide d'autres outils Google Cloud, consultez la page Examiner les résultats des analyses de protection des données sensibles et créer des rapports.

Étape suivante