Classification, masquage et anonymisation

Cloud DLP (Cloud Data Loss Prevention) vous aide à comprendre, gérer et protéger les données sensibles. Avec Cloud DLP, vous pouvez facilement classifier et masquer les données sensibles apparaissant dans des contenus de type texte et dans des images, y compris des contenus stockés dans des dépôts Google Cloud Storage.

Classification de texte

Examinez l'entrée de texte suivante :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Nous obtenons une liste de résultats organisés dans les catégories suivantes :

  • InfoType
  • Likelihood
  • Offset (l'emplacement de la chaîne où la valeur InfoType potentielle a été trouvée)

Des exemples de résultats sont indiqués dans le tableau ci-dessous.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Masquage automatique de texte

Plutôt que de vous présenter une liste de résultats, le masquage automatique génère un résultat duquel sont effacées les correspondances de données sensibles.

Exemple d'entrée avec masquage automatique :

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Exemple de résultat utilisant un espace réservé "***" :

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classification d'images

Cloud DLP identifie du texte à l'aide de la technologie de reconnaissance optique des caractères (OCR) avant de le classifier. Comme pour la classification de texte, il renvoie les résultats, mais ajoute également un cadre de délimitation là où le texte a été trouvé.

Classification du stockage

La classification du stockage analyse les données stockées dans Cloud Storage, Datastore et BigQuery. Au lieu de diffuser les données dans Cloud DLP, vous spécifiez dans votre requête l'emplacement de stockage du bucket Cloud Storage, du genre Datastore ou de la table BigQuery que vous souhaitez faire analyser par Cloud DLP.

Une liste des extensions correspondant aux types de fichiers que Cloud DLP peut analyser est disponible sur la page de la documentation de référence concernant FileType. Les fichiers de types non reconnus sont analysés en tant que fichiers binaires.

Les résultats de l'analyse peuvent être enregistrés dans une nouvelle table BigQuery ou publiés dans un sujet Pub/Sub. Vous pouvez alors vous servir des outils BigQuery intégrés pour générer des analyses SQL approfondies ou des outils tels que Google Data Studio pour générer des rapports.

Pour plus d'informations sur l'analyse de données sensibles dans les dépôts de stockage à l'aide de Cloud DLP, consultez la page Inspecter le stockage et les bases de données pour identifier les données sensibles.

Pour en savoir plus sur la visualisation des résultats d'analyse à l'aide d'autres outils Google Cloud, consultez la page Examiner les résultats des analyses DLP et créer des rapports.