Cloud Data Loss Prevention (Cloud DLP) fait désormais partie de la protection des données sensibles. Le nom de l'API reste le même: API Cloud Data Loss Prevention (DLP). Pour en savoir plus sur les services qui constituent Sensitive Data Protection, consultez la section Présentation de Sensitive Data Protection.

Cette page a été traduite par l'API Cloud Translation.

Documentation de référence sur les métriques

Cette page liste et décrit toutes les métriques collectées dans les profils de données.

Il existe trois types de profils de données : les profils de données de projet, les profils de données de table et les profils de données de colonne.

Profils de données de projet

Chaque profil de données de projet comporte les champs suivants. Les valeurs de ces champs sont agrégées en fonction des ressources profilées dans le projet.

Insights

Les profils de données de projet fournissent les insights suivants :

Risque lié aux données: Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.
Confidentialité: Score indiquant le niveau de sensibilité de ce projet. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.

Métadonnées

Les profils de données de projet fournissent les métadonnées suivantes :

Dernier profil généré: Date et heure de la dernière génération du profil.
ID du projet: ID du projet qui a été profilé.
Nom de la ressource: Nom complet du profil de données.
État: Icône indiquant l'état de l'opération de profilage.

Profils de données de table

Chaque profil de données de table comporte les champs suivants :

Insights

Les profils de données de table fournissent les insights suivants :

Risque lié aux données: Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.
Confidentialité: Score indiquant le niveau de sensibilité de ce tableau. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.

Métadonnées

Les profils de données de table fournissent les métadonnées suivantes :

Base de données: Base de données contenant la table qui a été profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
ID de l'ensemble de données: ID de l'ensemble de données contenant la table.
Chiffrement: Indique si le chiffrement de la table est géré par Google ou par votre organisation.
Date/Heure d'expiration: Facultatif. Date et heure d'expiration de cette table.
Nombre de colonnes en échec: Nombre de colonnes ignorées dans la table en raison d'une erreur.
Instantané de la configuration d'inspection: Instantané du modèle d'inspection utilisé lors de la génération du profil. Pour en savoir plus, consultez Instantanés de profil de données.
Instance: Instance contenant la table qui a été profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
Dernier profil généré: Date et heure de la dernière génération du profil.
Dernière mise à jour dans BigQuery: Date et heure de la dernière modification de cette table.
ID du projet: ID du projet contenant la table.
Public: Indique si la table est disponible pour tous les utilisateurs ou pour certains utilisateurs uniquement.

Remarque : Consultez le problème connu lié à ce champ.
Étiquettes de ressource: Libellés associés à la table au moment de la génération du profil.
Tags de ressource: Tags associés à la table au moment de la génération du profil.
Nom de la ressource: Nom complet du profil de données.
Nombre de lignes: Nombre de lignes de la table lorsque le profil a été généré.
Nombre de colonnes analysées: Nombre de colonnes profilées dans la table.
Compte de service: Nombre de comptes de service disposant d'autorisations IAM pour accéder à cette table.
État: Indique si le profil a été généré avec succès.
ID de la table: ID de la table.
Heure de création de la table: Date et heure de création de la table.
Taille de la table: Taille de la table au moment de la génération du profil.
Type: Le type de découverte effectué.

Profils de données de colonne

Chaque profil de données de colonne comporte les champs suivants :

Insights

Les profils de données de colonne fournissent les insights suivants :

Risque lié aux données

Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.

Confidentialité

Score indiquant le niveau de sensibilité de la colonne. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.

InfoType prédit

Si un seul infoType intégré ou personnalisé prévaut clairement sur les autres dans la colonne, la protection des données sensibles définit ce champ sur cet infoType. Sinon, ce champ n'a aucune valeur.

Pour voir la liste de tous les infoTypes détectés dans la colonne, consultez le champ Autres infoTypes.

Sensitive Data Protection ne recherche que les infoTypes que vous avez spécifiés dans le modèle d'inspection. Par conséquent, seuls ces infoTypes peuvent apparaître dans le champ InfoType prédit. Par exemple, si la colonne contient des adresses e-mail, mais que vous n'avez pas inclus le détecteur d'infoType EMAIL_ADDRESS dans votre modèle d'inspection, ce champ ne contient pas EMAIL_ADDRESS.

Si les données de la colonne correspondent principalement à plusieurs infoTypes étroitement liés appartenant à la même catégorie générale, Sensitive Data Protection définit ce champ sur l'infoType le plus général. Par exemple, si la colonne contient principalement un mélange d'infoTypes PASSPORT, AUSTRALIA_PASSPORT et CANADA_PASSPORT, le champ InfoType prédit est défini sur PASSPORT. Le champ Autres infoTypes affiche les infoTypes plus spécifiques et leur prévalence estimée.

Autres infoTypes

InfoTypes détectés dans la colonne qui ne présentent pas un signal suffisamment fort pour être considérés comme l'infoType prédit de cette colonne. Dans ce document, consultez la section InfoType prédit.

Pour les profils de données générés après le 13 octobre 2022, chaque infoType listé dans ce champ présente une prévalence estimée. La prévalence estimée est un pourcentage approximatif de lignes non nulles dans lesquelles l'infoType a été détecté.

Par exemple, supposons que vous disposiez d'une colonne contenant les métriques suivantes :

InfoType prédit : FDA_CODE
Autres infoTypes : PERSON_NAME (2%), STREET_ADDRESS (1%)

Dans cet exemple, tout indique que la colonne contient des codes FDA. La protection des données sensibles a également déterminé qu'environ 2 % des lignes non nulles de la colonne pouvaient contenir des noms de personnes et 1 % des adresses postales.

Sensitive Data Protection ne recherche que les infoTypes que vous avez spécifiés dans le modèle d'inspection. Par conséquent, seuls ces infoTypes peuvent apparaître dans le champ Autres infoTypes. Par exemple, si la colonne contient des adresses e-mail, mais que vous n'avez pas inclus le détecteur d'infoType EMAIL_ADDRESS dans votre modèle d'inspection, ce champ ne contient pas EMAIL_ADDRESS.

Proportion estimée de valeurs nulles

Proportion approximative de valeurs nulles dans cette colonne, classée comme élevée, moyenne, faible ou très faible. Cette valeur est élevée si une grande partie des entrées de cette colonne est nulle.

Unicité estimée

Estimation du volume de données uniques dans cette colonne, classé comme élevé, moyen ou faible. Un niveau d'unicité élevé suggère que la colonne contient des valeurs distinctes. Une forte présence de valeurs uniques peut indiquer que la colonne contient des identifiants.

Un niveau d'unicité faible suggère que la colonne contient de nombreuses valeurs courantes, telles que des énumérations ou des valeurs booléennes.

Si la protection des données sensibles détermine qu'il n'y a pas assez de lignes dans le tableau pour calculer cette métrique, cette valeur est vide.

Score du texte libre

Probabilité que la colonne contienne du texte libre. Une valeur proche de 1 indique que la colonne est susceptible de contenir du texte libre ou en langage naturel. Les valeurs possibles sont comprises entre 0 et 1.

Un score de texte libre élevé peut augmenter les niveaux de risque et de sensibilité liés aux données d'une colonne.

Métadonnées

Les profils de données de colonne fournissent les métadonnées suivantes :

Base de données: Base de données contenant la colonne de table profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
Type de données: Type de données du contenu de la colonne.
ID de l'ensemble de données: ID de l'ensemble de données contenant la colonne de table.
ID du champ: Nom de la colonne.
Instance: Instance contenant la colonne de table qui a été profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
Emplacement des instances: Emplacement de l'instance contenant la colonne de table profilée. Ce champ ne s'applique qu'à la découverte Cloud SQL.
Dernier profil généré: Date et heure de la dernière génération du profil.
Tags avec stratégie: Indique si un tag avec stratégie est appliqué à la colonne. Pour en savoir plus sur les bonnes pratiques concernant l'utilisation des tags avec stratégie, consultez Utiliser des tags avec stratégie dans BigQuery.
ID du projet: ID du projet contenant la colonne de table.
Nom de la ressource: Nom complet du profil de données.
État: Icône indiquant l'état de l'opération de profilage.
ID de la table: ID de la table contenant la colonne.

Profils de données du magasin de fichiers

La protection des données sensibles utilise le terme magasin de fichiers pour désigner un bucket ou un conteneur de stockage de fichiers.

Chaque profil de données de magasin de fichiers comporte les champs suivants.

Insights

Les profils de données du magasin de fichiers fournissent les insights suivants :

Risque lié aux données: Niveau de risque associé aux données dans leur état actuel. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.
Clusters de fichiers: Fournit un récapitulatif pour chaque cluster de fichiers détecté lors du profilage de ce magasin de fichiers. Pour en savoir plus sur chaque résumé, consultez Résumés des clusters de fichiers sur cette page.
Confidentialité: Score indiquant le niveau de sensibilité de ce magasin de fichiers. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.

Métadonnées

Les profils de données du magasin de fichiers fournissent les métadonnées suivantes :

Emplacements de stockage des données

Si vous avez profilé un bucket Cloud Storage birégional, ce champ liste les deux régions.

Si vous avez profilé un magasin de fichiers d'un autre fournisseur de services cloud, cette valeur correspond à la région dans laquelle le fournisseur de services cloud stocke le magasin de fichiers.

Chiffrement

Indique si le chiffrement de ce magasin de fichiers est géré par Google ou par votre organisation.

Type de store de fichiers

Source des données profilées : Cloud Storage, Amazon S3 ou Azure Blob Storage.

Chemin d'accès au magasin de fichiers

Nom du magasin de fichiers.

Instantané de la configuration d'inspection

Instantané du modèle d'inspection utilisé lors de la génération du profil. Pour en savoir plus, consultez Instantanés de profil de données.

Type de lieu

Type d'emplacement où le fichier est stocké : region, dual-region ou multi-region.

Profil créé en premier

Date et heure de la première création du profil.

Dernier profil généré

Date et heure de la dernière génération du profil.

ID parent

Ressource propriétaire des données profilées.

Si le profil de données concerne une ressource Google Cloud , il s'agit de l'ID du projet contenant les données.
Si le profil de données concerne un bucket Amazon S3, il s'agit de l'ID du compte AWS contenant le bucket.
Si le profil de données concerne un conteneur Azure Blob Storage, il s'agit de l'ID de l'abonnement Azure contenant le conteneur.

Public

Indique si ce magasin de fichiers est disponible pour tous les utilisateurs ou pour certains utilisateurs uniquement.

Étiquettes de ressource

Libellés associés au magasin de fichiers au moment de la génération du profil.

Tags de ressource

Tags associés au magasin de fichiers au moment de la génération du profil.

Emplacement de la ressource

Région ou zone multirégionale contenant le magasin de fichiers.

Si vous avez profilé un bucket Cloud Storage birégional, cette valeur dépend de l'emplacement du bucket (dans une région birégionale prédéfinie ou non) :

Pour les emplacements birégionaux prédéfinis, Sensitive Data Protection définit cette valeur sur le nom de l'emplacement birégional prédéfini.
Pour les régions doubles standards, Sensitive Data Protection définit cette valeur sur la région multiple qui contient les régions doubles. Pour savoir comment les régions sont mappées aux zones multirégionales, consultez Régions doubles.

Nom de la ressource

Nom complet du profil de données.

État

Indique si le profil a été généré avec succès.

Résumés des clusters de fichiers

Lorsqu'un profil de données de magasin de fichiers est généré, les fichiers sont regroupés en clusters de fichiers. Sensitive Data Protection fournit un récapitulatif pour chaque cluster de fichiers.

Chaque récapitulatif de cluster de fichiers comporte les champs suivants :

Risque lié aux données: Niveau de risque associé aux données de ce groupe de fichiers. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.
Erreurs: Toutes les erreurs détectées lors de la génération du profil de données du fichier store.
Extensions de fichier analysées: Liste des types de fichiers détectés et analysés pour générer le profil de données du magasin de fichiers.
Extensions de fichier détectées: Liste des types de fichiers détectés, mais pas nécessairement analysés.
InfoTypes: Liste des infoTypes intégrés et personnalisés détectés dans ce cluster de fichiers.
Confidentialité: Score indiquant le niveau de sensibilité de ce cluster de fichiers. Pour en savoir plus, consultez Niveaux de sensibilité et de risques liés aux données.
Type: Indique la catégorie de fichiers de ce cluster. Pour en savoir plus sur tous les clusters de fichiers compatibles, consultez Clusters de fichiers compatibles dans les opérations de découverte.

Remarque : Si la protection des données sensibles analyse un fichier dans un fichier d'archive, la valeur de ce champ est ARCHIVE_FILE_EXTENSION/SCANNED_FILE_EXTENSION (par exemple, zip/csv).