Mettre en œuvre des mesures correctives basées sur les résultats du profileur de données

Cette page décrit les étapes à suivre pour mettre en œuvre des mesures correctives basées sur les résultats des profils de données.

Risque élevé lié aux données

Les éléments de données présentant un risque élevé lié aux données sont ceux contenant potentiellement des informations sensibles sans protection supplémentaire. Pour réduire le score de risque lié aux données, procédez comme suit :

  • Pour les colonnes BigQuery contenant des données sensibles, appliquez un tag avec stratégie BigQuery afin de limiter l'accès aux comptes disposant de droits d'accès spécifiques.

    Avant d'apporter cette modification, assurez-vous que votre agent de service dispose des autorisations requises pour profiler les tables avec des restrictions au niveau des colonnes. Sinon, la protection des données sensibles affiche une erreur. Pour en savoir plus, consultez la page Résoudre les problèmes liés au profileur de données.

  • Anonymisez les données sensibles brutes à l'aide de techniques d'anonymisation telles que le masquage et la tokenisation.

  • Si vous n'avez pas besoin des données à haut risque, envisagez de les supprimer.

Score de texte libre élevé

Une colonne avec un score de texte libre élevé, en particulier une colonne contenant plusieurs infoTypes (tels que PHONE_NUMBER, US_SOCIAL_SECURITY_NUMBER et DATE_OF_BIRTH), peut contenir des données non structurées et des instances d'informations personnelles. Cette colonne peut être un champ de note ou de commentaire. Le texte libre présente un risque potentiel. Par exemple, dans ces champs, un utilisateur peut saisir "Le client est né le 1er Janvier 1985".

La protection des données sensibles est conçue pour gérer les données non structurées. Pour mieux comprendre ce type de données, envisagez de procéder comme suit :

  • Pour les données BigQuery et Cloud Storage, vous pouvez identifier les emplacements exacts des informations personnelles en exécutant une inspection à la demande sur la table BigQuery ou le bucket Cloud Storage.

  • Anonymisez les données sensibles brutes à l'aide de techniques telles que le masquage et la tokenisation.

Étape suivante