La protection des données sensibles vous aide à comprendre, gérer et protéger les données sensibles. Avec la protection des données sensibles, vous pouvez facilement classer et masquer les données sensibles contenues dans des contenus textuels et des images, y compris des contenus stockés dans des dépôts Google Cloud Storage.
Classification de texte
Examinez l'entrée de texte suivante :
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Nous obtenons une liste de résultats organisés dans les catégories suivantes :
InfoType
Likelihood
Offset
(l'emplacement de la chaîne où la valeurInfoType
potentielle a été trouvée)
Des exemples de résultats sont indiqués dans le tableau ci-dessous.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Masquage automatique de texte
Plutôt que de vous présenter une liste de résultats, le masquage automatique génère un résultat duquel sont effacées les correspondances de données sensibles.
Exemple d'entrée avec masquage automatique :
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Exemple de résultat utilisant un espace réservé "***" :
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Classification d'images
La protection des données sensibles utilise la technologie de reconnaissance optique des caractères (OCR) pour reconnaître du texte avant la classification. Comme pour la classification de texte, il renvoie les résultats, mais ajoute également un cadre de délimitation là où le texte a été trouvé.
Classification du stockage
La classification du stockage analyse les données stockées dans Cloud Storage, Firestore en mode Datastore (Datastore) et BigQuery. Au lieu d'insérer des données en flux continu dans le service de protection des données sensibles, vous spécifiez dans votre requête l'emplacement de stockage du bucket Cloud Storage, du genre Datastore ou de la table BigQuery que la protection des données sensibles doit analyser.
Lors de l'analyse de fichiers hébergés dans des emplacements Cloud Storage, la protection des données sensibles permet l'analyse des fichiers binaires, texte, image, Microsoft Word, Microsoft Excel, Microsoft Powerpoint, PDF et Apache Avro. Une liste des extensions de fichiers correspondant aux types de fichiers dans Cloud Storage que la protection des données sensibles peut analyser est disponible sur la page de référence de l'API pour FileType
.
Les fichiers de types non reconnus sont analysés en tant que fichiers binaires.
Les résultats de l'analyse peuvent être enregistrés dans une nouvelle table BigQuery ou publiés dans un sujet Pub/Sub. Vous pouvez alors utiliser les outils BigQuery intégrés pour exécuter des analyses SQL approfondies ou des outils tels que Looker Studio pour générer des rapports.
Pour en savoir plus sur l'analyse des données sensibles dans les dépôts de stockage à l'aide de la protection des données sensibles, consultez la page Inspecter le stockage et les bases de données pour identifier les données sensibles.
Pour en savoir plus sur la visualisation des résultats d'analyse à l'aide d'autres outils Google Cloud, consultez la page Analyser des résultats liés à la protection des données sensibles et créer des rapports les concernant.
Étapes suivantes
- Apprenez-en plus sur l'inspection et le masquage d'images.
- Découvrez les méthodes de transformation que vous pouvez utiliser avec la protection des données sensibles.
- Suivez l'atelier de programmation Masquer les données sensibles avec la protection des données sensibles.
- Découvrez comment créer une copie anonymisée des données dans l'espace de stockage.