Documentation de référence sur les métriques

Cette page répertorie et décrit toutes les statistiques collectées dans les profils de données.

Il existe trois types de profils de données : les profils de données de projet, les profils de données de table et les profils de données de colonne.

Profils de données du projet

Chaque profil de données de projet comporte les champs suivants. Les valeurs de ces champs sont agrégées en fonction des ressources profilées au sein du projet.

Risque lié aux données
Niveau de risque associé aux données à son état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risque pour les données.
Dernier profil généré
La dernière fois que le profil a été généré.
ID du projet
ID du projet profilé.
Nom de la ressource
Nom complet du profil de données.
Sensibilité
Score indiquant le niveau de sensibilité de ce projet. Pour en savoir plus, consultez la section Niveaux de sensibilité et de risque pour les données.
État
Icône indiquant l'état de l'opération de profilage.

Profils de données de table

Chaque profil de données de table comporte les champs suivants:

Risque lié aux données
Niveau de risque associé aux données à son état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risque pour les données.
ID de l'ensemble de données
ID de l'ensemble de données contenant la table concernée.
Chiffrement
Indique si le chiffrement de cette table est géré par Google ou par votre organisation.
Date/Heure d'expiration
Facultatif. Heure d'expiration de cette table.
Nombre de colonnes en échec
Nombre de colonnes ignorées dans cette table en raison d'une erreur.
Utilisateurs en groupe
Nombre de groupes disposant d'autorisations IAM (gestion de l'authentification et des accès) pour accéder à cette table.
Utilisateurs individuels
Nombre d'utilisateurs disposant d'autorisations IAM pour accéder à cette table.
Instantané de la configuration d'inspection
Instantané du modèle d'inspection utilisé lors de la génération du profil. Pour en savoir plus, consultez Instantanés de profils de données.
Dernier profil généré
La dernière fois que le profil a été généré.
Dernière mise à jour dans BigQuery
Date et heure de la dernière modification de ce tableau.
ID du projet
ID du projet contenant cette table.
Public
Indique si ce tableau est disponible pour tous les utilisateurs ou pour certains utilisateurs uniquement.
Libellés de ressource
Libellés présents dans la table au moment de la génération du profil.
Nom de la ressource
Nom complet du profil de données.
Nombre de lignes
Nombre de lignes dans cette table lorsque le profil a été généré.
Nombre de colonnes analysées
Nombre de colonnes profilées dans ce tableau.
Sensibilité
Score indiquant le niveau de sensibilité de cette table. Pour en savoir plus, consultez Niveaux de sensibilité et de risque pour les données.
Compte de service
Nombre de comptes de service disposant d'autorisations IAM pour accéder à cette table.
État
Icône indiquant l'état de l'opération de profilage.
ID de la table
ID de cette table.
Taille de la table
Taille de ce tableau lors de la génération du profil.

Profils de données de colonne

Chaque profil de données de colonne comporte les champs suivants:

Risque lié aux données
Niveau de risque associé aux données à son état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risque pour les données.
Type de données
Type de données du contenu de cette colonne.
ID de l'ensemble de données
ID de l'ensemble de données contenant la colonne de cette table.
Pourcentage de valeurs nulles estimé
Pourcentage approximatif de lignes pour lesquelles cette colonne est nulle.
ID du champ
Nom de la colonne.
Score du texte libre

Probabilité que cette colonne contienne du texte libre. Une valeur proche de 1 indique que la colonne est susceptible de contenir du texte au format libre ou naturel. Les valeurs possibles sont comprises entre 0 et 1.

Un score de texte libre élevé peut augmenter les niveaux de risque et de sensibilité des données d'une colonne.

Dernier profil généré

Heure de la dernière génération du profil.

Autres infoTypes

InfoTypes détectés par Cloud DLP dans la colonne.

Tags avec stratégie

Indique si un tag avec stratégie est appliqué à la colonne. Pour en savoir plus sur les bonnes pratiques en matière d'utilisation des tags avec stratégie, consultez la page Utiliser des tags avec stratégie dans BigQuery.

InfoType prédit

Si Cloud DLP détermine qu'un infoType intégré ou personnalisé prédomine clairement par rapport aux autres valeurs de cette colonne, il définit ce champ sur cet infoType. Sinon, Cloud DLP indique Mixte. Pour afficher la liste de tous les infoTypes détectés dans la colonne, consultez le champ Autres infoTypes.

Seuls les infoTypes que vous avez spécifiés dans votre modèle d'inspection peuvent s'afficher ici. Par exemple, si la colonne contient des adresses e-mail, mais que vous n'avez pas inclus le détecteur d'infoType EMAIL_ADDRESS dans votre modèle d'inspection, EMAIL_ADDRESS n'apparaît pas ici.

ID du projet

ID du projet contenant cette colonne de table.

Nom de la ressource

Nom complet du profil de données.

Sensibilité

Score indiquant le niveau de sensibilité de cette colonne. Pour en savoir plus, consultez la section Niveaux de sensibilité et de risque pour les données.

État

Icône indiquant l'état de l'opération de profilage.

ID de la table

ID de la table contenant cette colonne.

Score d'unicité

Une valeur proche de 1 indique que la colonne peut contenir des identifiants uniques, tels que des ID utilisateur. Une valeur proche de 0 indique que la colonne contient peu de valeurs uniques, telles que des valeurs booléennes ou d'autres classificateurs. Les valeurs possibles sont comprises entre 0 et 1.

Un score d'unicité élevé peut augmenter les niveaux de risque et de sensibilité des données d'une colonne.