Cloud Data Loss Prevention (Cloud DLP) fait désormais partie de la protection des données sensibles. Le nom de l'API reste le même: API Cloud Data Loss Prevention (API DLP). Pour en savoir plus sur les services qui composent la protection des données sensibles, consultez Présentation de la protection des données sensibles.

Ajouter des tags aux tables dans Dataplex en fonction des insights issus des profils de données

Cette page explique comment appliquer automatiquement des tags Dataplex aux tables BigQuery une fois que la protection des données sensibles a profilé ces tables. Cette page fournit également des exemples de requêtes que vous pouvez utiliser pour rechercher des données taguées dans votre organisation et vos projets.

Cette fonctionnalité est utile si vous souhaitez enrichir vos métadonnées sélectionnées manuellement dans Dataplex avec des insights collectés à partir de profils de données de protection des données sensibles. Les balises générées incluent les insights suivants:

Types d'informations (infoTypes) détectés dans les colonnes de la table
Niveau de sensibilité calculé de la table
Niveau de risque lié aux données calculé de la table

Les insights issus des profils de données sensibles associés à la protection des données peuvent vous aider à utiliser Dataplex pour identifier les données sensibles et à haut risque dans votre organisation. Utilisez ces insights pour vous aider à prendre des décisions éclairées sur la façon de gérer et de gouverner vos données.

Si vous souhaitez envoyer les résultats des tâches d'inspection (et non les opérations de profilage des données) à Dataplex, consultez plutôt la section Envoyer les résultats de l'inspection liée à la protection des données sensibles à Data Catalog.

À propos des profils de données

Vous pouvez configurer la protection des données sensibles pour générer automatiquement des profils sur les données d'une organisation, d'un dossier ou d'un projet. Les profils de données contiennent des métriques et des métadonnées sur vos données, et vous aident à déterminer où résident les données sensibles et à haut risque. La protection des données sensibles enregistre ces métriques à différents niveaux de détail. Pour en savoir plus sur les types de données que vous pouvez profiler, consultez la page Ressources acceptées.

À propos de Dataplex et de Data Catalog

Dataplex est un service Google Cloud qui unifie les données distribuées, et automatise leur gestion et leur gouvernance. Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif au sein de Dataplex.

Data Catalog vous permet d'utiliser des tags et des modèles de tag pour associer des métadonnées métier à vos données. Vous pouvez ensuite rechercher et gérer toutes les métadonnées de votre organisation ou de votre projet dans un service unifié. Pour en savoir plus, consultez la section Balises et modèles de tag.

Fonctionnement

Si l'action Envoyer à Dataplex sous forme de tags est activée dans votre configuration d'analyse de découverte, la protection des données sensibles effectue les opérations suivantes chaque fois qu'elle profile vos données. Cette action n'est appliquée qu'aux profils nouveaux et mis à jour. Les profils existants qui ne sont pas mis à jour ne sont pas envoyés à Dataplex.

Crée un modèle de tag privé contenant le schéma des tags qui seront associés à vos tables BigQuery. Pour en savoir plus sur le nom, l'ID et l'emplacement du modèle de balise, consultez Informations sur le modèle de tag.

Seuls les comptes principaux disposant des rôles et des autorisations appropriés peuvent afficher le modèle de tag.

Il crée un tag pour chaque table BigQuery que vous profilez. Le tag est basé sur le modèle de tag que vous venez de créer.

Par exemple, un tag résultant associé à une table peut comporter les métadonnées suivantes:

Nom à afficher	Valeur
`Column Insights`	`ccn: CREDIT_CARD_NUMBER` `first_name: PERSON_NAME` `last_name: PERSON_NAME` `ssn: US_SOCIAL_SECURITY_NUMBER` `email: EMAIL_ADDRESS`
`Column Sensitivity`	`ccn: HIGH` `first_name: MODERATE` `last_name: MODERATE` `favorite_animal: LOW` `ssn: HIGH` `email: MODERATE` `id: LOW`
`Data Risk Level`	`HIGH`
`Other InfoTypes`	`PHONE_NUMBER`
`Predicted InfoTypes`	`CREDIT_CARD_NUMBER,US_SOCIAL_SECURITY_NUMBER,EMAIL_ADDRESS,PERSON_NAME`
`Profile Last Generated`	`DATE at TIME`
`Sensitive Data Profile`	`organizations/ORGANIZATION_ID/locations/REGION/tableDataProfiles/TABLE_DATA_PROFILE_ID`
`Sensitivity Score`	`HIGH`

Une table comporte deux tags si elle a été profilée à l'aide des deux tags suivants:

Configuration d'analyse au niveau de l'organisation ou du dossier
Une configuration d'analyse au niveau du projet

Une fois que vous avez ajouté des tags aux tables, vous pouvez rechercher dans Dataplex toutes les données de votre organisation ou de votre projet avec des valeurs de tag spécifiques.

Détails du modèle de tag

Le nom du modèle, l'ID du modèle et le projet dans lequel le nouveau modèle de tag est stocké dépendent de la ressource à laquelle la configuration d'analyse appartient.

Si la configuration de l'analyse est une configuration au niveau de l'organisation ou du dossier, le modèle de tag est stocké dans le conteneur d'agent de service. Le nom du modèle de tag est Sensitive Data Profile. Son ID de modèle est sensitive_data_profile.
Si la configuration d'analyse est une configuration au niveau du projet, le modèle de tag est stocké dans le projet à profiler. Le nom du modèle de tag est Sensitive Data Profile (Project). Son ID de modèle est sensitive_data_profile_project.

Tarification

Pour en savoir plus sur les frais d'exportation de profils de données d'autres services Google Cloud, consultez la section Tarifs d'exportation de profils de données.

Taguer automatiquement les tables BigQuery en fonction des profils de données

Créez une configuration d'analyse. Vous pouvez également modifier une configuration d'analyse existante.
- Pour créer une configuration d'analyse au niveau d'une organisation ou d'un dossier, consultez Profiler des données dans une organisation ou un dossier.
- Pour créer une configuration d'analyse au niveau du projet, consultez Profiler les données dans un seul projet.
À l'étape Ajouter des actions, assurez-vous que l'option Envoyer à Dataplex sous forme de tags est activée.
- Si vous créez une configuration d'analyse, cette action est activée par défaut.
- Si vous modifiez une configuration d'analyse, vous devez activer cette action.

Une fois les données profilées et taguées, vous pouvez commencer à rechercher des données taguées dans Dataplex.

Rôles et autorisations pour afficher les tags

Les résultats de recherche Dataplex ne vous montrent que les données auxquelles vous avez accès. Vous devez disposer des rôles ou autorisations IAM (Identity and Access Management) suivants pour rechercher les tags associés à vos tables BigQuery.

Objectif	Rôle prédéfini	Autorisations pertinentes
Afficher le modèle de tag privé	Lecteur de modèles de tag Data Catalog (`roles/datacatalog.tagTemplateViewer`)	`datacatalog.tagTemplates.getTag`
Afficher les tags appliqués aux tables BigQuery	Lecteur de métadonnées BigQuery (`roles/bigquery.metadataViewer`)	`bigquery.datasets.get` `bigquery.tables.get`

Pour en savoir plus sur les rôles Dataplex, consultez la section Rôles permettant d'afficher les tags publics et privés.

Pour en savoir plus sur l'attribution d'un rôle prédéfini, consultez Attribuer un seul rôle. Si vous souhaitez utiliser un rôle personnalisé au lieu d'un rôle prédéfini, assurez-vous que celui-ci dispose des autorisations appropriées. Pour en savoir plus, consultez Créer un rôle personnalisé.

Rechercher le modèle de tag généré

Dans la console Google Cloud, accédez à la page Modèles de tag de Dataplex.

Accéder aux modèles de tag
Dans la liste, recherchez le modèle de tag. Pour en savoir plus sur le nom, l'ID et l'emplacement du modèle de tag, consultez Détails du modèle de tag.
Facultatif: Pour trouver le modèle de tag généré par une configuration d'analyse de découverte donnée, saisissez la commande suivante dans le champ Filtre:
```
name:PROJECT_ID.TAG_TEMPLATE_ID
```
Remplacez les éléments suivants :
- PROJECT_ID: ID du projet associé à la configuration d'analyse. Si vous avez profilé vos données au niveau de l'organisation ou d'un dossier, saisissez l'ID de projet du conteneur de l'agent de service.
- TAG_TEMPLATE_ID : sensitive_data_profile si la configuration de l'analyse est destinée à une organisation ou à un dossier ; sensitive_data_profile_project si la configuration de l'analyse est destinée à un projet.

Rechercher le tag généré pour un profil de données de table donné

Dans la console Google Cloud, accédez à la page de recherche de Dataplex.

Accéder à la recherche
Dans le champ Rechercher, saisissez les informations suivantes:
```
name:TABLE_ID tag:PROJECT_ID.TAG_TEMPLATE_ID
```
Remplacez les éléments suivants :
- TABLE_ID: ID de la table profilée.
- PROJECT_ID: ID du projet contenant le modèle de tag. Si vous avez profilé vos données au niveau de l'organisation ou d'un dossier, saisissez l'ID de projet du conteneur de l'agent de service.
- TAG_TEMPLATE_ID : sensitive_data_profile si la configuration de l'analyse est destinée à une organisation ou à un dossier ; sensitive_data_profile_project si la configuration de l'analyse est destinée à un projet.
Dans la liste qui s'affiche, cliquez sur l'ID de la table. Les détails de la table BigQuery s'affichent avec les tags Sensitive Data Profile ou Sensitive Data Profile (Project) associés.

Une table comporte deux tags si elle a été profilée à l'aide des deux tags suivants:
- Configuration d'analyse au niveau de l'organisation ou du dossier
- Une configuration d'analyse au niveau du projet

Pour savoir comment effectuer une recherche via l'API Data Catalog, consultez Rechercher des éléments de données.

Exemples de requêtes de recherche

Cette section fournit des exemples de requêtes de recherche que vous pouvez utiliser dans Dataplex pour rechercher des données dans votre organisation ou votre projet avec des valeurs de tag spécifiques.

Vous ne pouvez consulter que les données auxquelles vous avez accès. L'accès aux données est contrôlé via des autorisations IAM. Pour en savoir plus, consultez la section Rôles et autorisations d'affichage des tags sur cette page.

Vous pouvez saisir ces requêtes sur la page Search de Dataplex dans la console Google Cloud.

Accéder à la recherche

Pour en savoir plus sur la formation des requêtes, consultez la section Syntaxe de la recherche dans Data Catalog. Pour savoir comment effectuer une recherche via l'API Data Catalog, consultez la page Rechercher des éléments de données.