Classification, masquage et anonymisation

La protection des données sensibles vous aide à comprendre, gérer et protéger les données sensibles. Avec la protection des données sensibles, vous pouvez facilement classer et masquer les données sensibles contenues dans des contenus textuels et des images, y compris des contenus stockés dans des dépôts Google Cloud Storage.

Classification de texte

Examinez l'entrée de texte suivante :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Nous obtenons une liste de résultats organisés dans les catégories suivantes :

  • InfoType
  • Likelihood
  • Offset (l'emplacement de la chaîne où la valeur InfoType potentielle a été trouvée)

Des exemples de résultats sont indiqués dans le tableau ci-dessous.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Masquage automatique de texte

Plutôt que de vous présenter une liste de résultats, le masquage automatique génère un résultat duquel sont effacées les correspondances de données sensibles.

Exemple d'entrée avec masquage automatique :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemple de résultat utilisant un espace réservé "***" :

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classification d'images

La protection des données sensibles utilise la technologie de reconnaissance optique des caractères (OCR) pour reconnaître du texte avant la classification. Comme pour la classification de texte, il renvoie les résultats, mais ajoute également un cadre de délimitation là où le texte a été trouvé.

Classification du stockage

La classification du stockage analyse les données stockées dans Cloud Storage, Firestore en mode Datastore (Datastore) et BigQuery. Au lieu d'insérer des données en flux continu dans le service de protection des données sensibles, vous spécifiez dans votre requête l'emplacement de stockage du bucket Cloud Storage, du genre Datastore ou de la table BigQuery que la protection des données sensibles doit analyser.

Lors de l'analyse de fichiers hébergés dans des emplacements Cloud Storage, la protection des données sensibles permet l'analyse des fichiers binaires, texte, image, Microsoft Word, Microsoft Excel, Microsoft Powerpoint, PDF et Apache Avro. Une liste des extensions de fichiers correspondant aux types de fichiers dans Cloud Storage que la protection des données sensibles peut analyser est disponible sur la page de référence de l'API pour FileType. Les fichiers de types non reconnus sont analysés en tant que fichiers binaires.

Les résultats de l'analyse peuvent être enregistrés dans une nouvelle table BigQuery ou publiés dans un sujet Pub/Sub. Vous pouvez alors utiliser les outils BigQuery intégrés pour exécuter des analyses SQL approfondies ou des outils tels que Looker Studio pour générer des rapports.

Pour en savoir plus sur l'analyse des données sensibles dans les dépôts de stockage à l'aide de la protection des données sensibles, consultez la page Inspecter le stockage et les bases de données pour identifier les données sensibles.

Pour en savoir plus sur la visualisation des résultats d'analyse à l'aide d'autres outils Google Cloud, consultez la page Analyser des résultats liés à la protection des données sensibles et créer des rapports les concernant.

Étapes suivantes