Cette page liste et décrit toutes les métriques collectées dans les profils de données.
Il existe trois types de profils de données : les profils de données de projet, les profils de données de table et les profils de données de colonne.
Profils de données de projet
Chaque profil de données de projet comporte les champs suivants. Les valeurs de ces champs sont agrégées en fonction des ressources profilées dans le projet.
Insights
Les profils de données de projet fournissent les insights suivants:
- Risque lié aux données
- Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
- Confidentialité
- Score indiquant le niveau de sensibilité pour ce projet. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
Métadonnées
Les profils de données de projet fournissent les métadonnées suivantes:
- Dernier profil généré
- Date et heure de la dernière génération du profil.
- ID du projet
- ID du projet profilé.
- Nom de la ressource
- Nom complet du profil de données.
- État
- Icône indiquant l'état de l'opération de profilage.
Profils de données de table
Chaque profil de données de table comporte les champs suivants :
Insights
Les profils de données de table fournissent les insights suivants:
- Risque lié aux données
- Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
- Confidentialité
- Score indiquant le niveau de sensibilité pour cette table. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
Métadonnées
Les profils de données de table fournissent les métadonnées suivantes:
- Base de données
- Base de données contenant la table profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
- ID de l'ensemble de données
- ID de l'ensemble de données contenant la table.
- Chiffrement
- Indique si le chiffrement de la table est géré par Google ou par votre organisation.
- Date/Heure d'expiration
- Facultatif. Date et heure d'expiration de cette table.
- Nombre de colonnes en échec
- Nombre de colonnes ignorées dans la table en raison d'une erreur.
- Instantané de la configuration d'inspection
- Instantané du modèle d'inspection utilisé lors de la génération du profil. Pour en savoir plus, consultez la section Instantanés de profil de données.
- Instance
- Instance contenant la table qui a été profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
- Dernier profil généré
- Date et heure de la dernière génération du profil.
- Dernière mise à jour dans BigQuery
- Date et heure de la dernière modification de ce tableau.
- ID du projet
- ID du projet contenant la table.
- Public
- Indique si la table est disponible pour tous les utilisateurs ou pour certains utilisateurs uniquement.
- Libellés de ressource
- Libellés associés à la table au moment de la génération du profil.
- Nom de la ressource
- Nom complet du profil de données.
- Nombre de lignes
- Nombre de lignes de la table lorsque le profil a été généré .
- Nombre de colonnes analysées
- Nombre de colonnes profilées dans la table.
- Compte de service
- Nombre de comptes de service disposant d'autorisations IAM pour accéder à la table.
- État
- Indique si la génération du profil a réussi.
- ID de la table
- ID de la table.
- Heure de création de la table
- Date et heure de création du tableau.
- Taille de la table
- Taille de cette table lorsque le profil a été généré.
- Type
- Type de découverte effectué.
Profils de données de colonne
Chaque profil de données de colonne comporte les champs suivants :
Insights
Les profils de données de colonnes fournissent les insights suivants:
- Risque lié aux données
- Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
- Confidentialité
- Score indiquant le niveau de sensibilité pour cette colonne. Pour en savoir plus, consultez la section Sensibilité et niveaux de risque lié aux données.
- InfoType prédit
Si un infoType intégré ou personnalisé unique prévaut clairement sur les autres dans la colonne, la protection des données sensibles définit ce champ sur cet infoType. Sinon, ce champ n'a aucune valeur.
Pour voir la liste de tous les infoTypes détectés dans la colonne, reportez-vous au champ Autres infoTypes.
La protection des données sensibles analyse uniquement les infoTypes que vous avez spécifiés dans le modèle d'inspection. Ainsi, seuls ces infoTypes peuvent apparaître dans le champ InfoType prédit. Par exemple, si la colonne contient des adresses e-mail, mais que vous n'avez pas inclus le détecteur d'infoType
EMAIL_ADDRESS
dans votre modèle d'inspection, ce champ ne contient pasEMAIL_ADDRESS
.Dans ce document, consultez la section Autres infoTypes.
- Autres infoTypes
Les infoTypes détectés dans la colonne dont le signal n'est pas suffisamment puissant pour être considérés comme l'infoType prédit de cette colonne. Dans ce document, consultez la section InfoType prédit.
Pour les profils de données générés après le 13 octobre 2022, chaque infoType répertorié dans ce champ a une prévalence estimée. La prévalence estimée correspond au pourcentage approximatif de lignes non nulles dans lesquelles l'infoType a été détecté.
Par exemple, supposons que vous ayez une colonne contenant les métriques suivantes:
- infoType prédit:
FDA_CODE
- Autres infoTypes:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
Dans cet exemple, nous avons une forte indication que la colonne contient des codes FDA. La protection des données sensibles a également déterminé qu'environ 2% des lignes non nulles de la colonne pouvaient contenir des noms de personnes et 1% pouvait contenir des adresses postales.
La protection des données sensibles analyse uniquement les infoTypes que vous avez spécifiés dans le modèle d'inspection. Ainsi, seuls ces infoTypes peuvent apparaître dans le champ Autres infoTypes. Par exemple, si la colonne contient des adresses e-mail, mais que vous n'avez pas inclus le détecteur d'infoType
EMAIL_ADDRESS
dans votre modèle d'inspection, ce champ ne contient pasEMAIL_ADDRESS
.- infoType prédit:
- Proportion estimée de valeurs nulles
Proportion approximative de valeurs nulles dans cette colonne, classées comme élevée, moyenne, faible ou très faible. Cette valeur est élevée si une grande proportion d'entrées est nulle dans cette colonne.
- Unicité estimée
Estimation de la quantité de données uniques dans cette colonne (élevée, moyenne ou faible). Un niveau d'unicité élevé suggère que la colonne contient des valeurs distinctes. Une forte présence de valeurs uniques peut indiquer que la colonne contient des identifiants.
Un niveau d'unicité faible suggère que la colonne contient de nombreuses valeurs communes, telles que des énumérations ou des valeurs booléennes.
Si la protection des données sensibles détermine qu'il n'y a pas assez de lignes dans le tableau pour calculer cette métrique, cette valeur est vide.
- Score du texte libre
Probabilité que la colonne contienne du texte libre. Une valeur proche de 1 indique que la colonne est susceptible de contenir du texte libre ou en langage naturel. Les valeurs possibles sont comprises entre 0 et 1.
Un score de texte libre élevé peut augmenter les niveaux de risque et de sensibilité liés aux données d'une colonne.
Métadonnées
Les profils de données de colonnes fournissent les métadonnées suivantes:
- Base de données
- Base de données contenant la colonne de table profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
- Type de données
- Type de données du contenu de la colonne.
- ID de l'ensemble de données
- ID de l'ensemble de données contenant la colonne de table.
- ID du champ
- Nom de la colonne.
- Instance
- Instance contenant la colonne de table profilée. Ce champ s'applique uniquement à la découverte Cloud SQL.
- Emplacement des instances
- Emplacement de l'instance contenant la colonne de table profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
- Dernier profil généré
- Date et heure de la dernière génération du profil.
- Tags avec stratégie
- Indique si un tag avec stratégie est appliqué à la colonne. Pour en savoir plus sur les bonnes pratiques d'utilisation des tags avec stratégie, consultez la section Utiliser des tags avec stratégie dans BigQuery.
- ID du projet
- ID du projet qui contient cette colonne de tableau.
- Nom de la ressource
- Nom complet du profil de données.
- État
- Icône indiquant l'état de l'opération de profilage.
- ID de la table
- ID de la table qui contient cette colonne.