Cette page décrit les étapes à suivre pour mettre en œuvre des mesures correctives basées sur les résultats des profils de données.
Risque élevé lié aux données
Les éléments de données présentant un risque élevé lié aux données sont ceux contenant potentiellement des informations sensibles sans protection supplémentaire. Pour réduire le score de risque lié aux données, procédez comme suit :
Pour les colonnes BigQuery contenant des données sensibles, appliquez un tag avec stratégie BigQuery afin de limiter l'accès aux comptes disposant de droits d'accès spécifiques.
Avant d'apporter cette modification, assurez-vous que votre agent de service dispose des autorisations requises pour profiler les tables avec des restrictions au niveau des colonnes. Sinon, la protection des données sensibles affiche une erreur. Pour en savoir plus, consultez la page Résoudre les problèmes liés au profileur de données.
Anonymisez les données sensibles brutes à l'aide de techniques d'anonymisation telles que le masquage et la tokenisation.
Si vous n'avez pas besoin des données à haut risque, envisagez de les supprimer.
Score de texte libre élevé
Une colonne avec un score de texte libre élevé, en particulier une colonne contenant plusieurs infoTypes (tels que PHONE_NUMBER
, US_SOCIAL_SECURITY_NUMBER
et DATE_OF_BIRTH
), peut contenir des données non structurées et des instances d'informations personnelles. Cette colonne peut être un champ de note ou de commentaire. Le texte libre présente un risque potentiel. Par exemple, dans ces champs, un utilisateur peut saisir "Le client est né le 1er Janvier 1985".
La protection des données sensibles est conçue pour gérer les données non structurées. Pour mieux comprendre ce type de données, envisagez de procéder comme suit :
Pour les données BigQuery et Cloud Storage, vous pouvez identifier les emplacements exacts des informations personnelles en exécutant une inspection à la demande sur la table BigQuery ou le bucket Cloud Storage.
Anonymisez les données sensibles brutes à l'aide de techniques telles que le masquage et la tokenisation.
Étape suivante
Découvrez comment la protection des données sensibles calcule les niveaux de risque et de sensibilité des données de vos composants de données.
Découvrez comment la tokenisation rend les données utilisables sans remettre en cause la confidentialité.
Découvrez comment Forrester a classé Google Cloud parmi les leaders dans le domaine des plates-formes de sécurité de données non structurées.