Vous pouvez utiliser la protection des données sensibles pour calculer des statistiques numériques et catégoriques pour les colonnes individuelles des tables BigQuery. Sensitive Data Protection peut calculer les éléments suivants:
- La valeur minimale de la colonne
- La valeur maximale de la colonne
- Les quantiles pour la colonne
- Un histogramme des fréquences de valeur dans la colonne
Calculer des statistiques numériques
Vous pouvez déterminer les valeurs minimales et maximales, ainsi que les quantiles d'une colonne BigQuery individuelle. Pour calculer ces valeurs, vous devez configurer une tâche DlpJob
en définissant la métrique de confidentialité NumericalStatsConfig
sur le nom de la colonne à analyser. Lorsque vous exécutez la tâche, Sensitive Data Protection calcule les statistiques de la colonne donnée et renvoie les résultats dans l'objet NumericalStatsResult
. La protection des données sensibles peut calculer des statistiques pour les types de nombres suivants:
- entier
- Nombre à virgule flottante
- Date
- Date/Heure
- Horodatage
- Heure
Les statistiques renvoyées par un cycle d'analyse incluent la valeur minimale, la valeur maximale, ainsi que 99 quantiles qui partitionnent l'ensemble des valeurs de champ en 100 buckets de taille égale.
Exemples de code
Voici un exemple de code dans plusieurs langages qui montre comment utiliser la protection des données sensibles pour calculer des statistiques numériques.
C#
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
PHP
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Calculer des statistiques catégoriques
Vous pouvez calculer des statistiques catégoriques pour les différents buckets d'histogrammes d'une colonne BigQuery, y compris les suivantes :
- Limite supérieure de la fréquence de valeur dans un bucket donné
- Limite inférieure de la fréquence de valeur dans un bucket donné
- Taille d'un bucket donné
- Échantillon de fréquences de valeur dans un bucket donné (jusqu'à 20)
Pour calculer ces valeurs, vous devez configurer une tâche DlpJob
en définissant la métrique de confidentialité CategoricalStatsConfig
sur le nom de la colonne à analyser. Lorsque vous exécutez la tâche, Sensitive Data Protection calcule les statistiques de la colonne donnée et renvoie les résultats dans l'objet CategoricalStatsResult
.
Exemples de code
Voici un exemple de code dans plusieurs langages qui montre comment utiliser la protection des données sensibles pour calculer des statistiques catégoriques.
C#
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
PHP
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour la protection des données sensibles, consultez la page Bibliothèques clientes de la protection des données sensibles.
Pour vous authentifier auprès de la protection des données sensibles, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.