Profiler les données BigQuery dans une organisation ou un dossier

Cette page explique comment configurer la découverte de données BigQuery au niveau d'une organisation ou d'un dossier. Si vous souhaitez profiler un projet, consultez Profiler des données BigQuery dans un seul projet.

Pour en savoir plus sur le service de découverte, consultez Profils de données.

Pour commencer à profiler les données, vous devez créer une configuration d'analyse.

Avant de commencer

  1. Confirmez que vous disposez des autorisations IAM requises pour configurer des profils de données au niveau de l'organisation.

    Si vous ne disposez pas du rôle Administrateur de l'organisation (roles/resourcemanager.organizationAdmin) ni du rôle Administrateur de sécurité (roles/iam.securityAdmin), vous pouvez quand même créer une configuration d'analyse. Toutefois, une fois la configuration d'analyse créée, une personne disposant de l'un de ces rôles doit accorder l'accès au profilage des données à votre agent de service.

  2. Vous devez disposer d'un modèle d'inspection dans chaque région où vous avez des données à profiler. Si vous souhaitez utiliser un seul modèle pour plusieurs régions, vous pouvez utiliser un modèle stocké dans la région global. Si des règles d'administration vous empêchent de créer un modèle d'inspection dans la région global, vous devez définir un modèle d'inspection dédié pour chaque région. Pour en savoir plus, consultez Considérations relatives à la résidence des données.

    Cette tâche vous permet de créer un modèle d'inspection uniquement dans la région global. Si vous avez besoin de modèles d'inspection dédiés pour une ou plusieurs régions, vous devez créer ces modèles avant d'effectuer cette tâche.

  3. Pour envoyer des notifications Pub/Sub à un sujet lorsque certains événements se produisent (par exemple, lorsqu'un profil de protection des données sensibles est appliqué à une nouvelle table), créez un sujet Pub/Sub avant d'effectuer cette tâche.

  4. Vous pouvez configurer Sensitive Data Protection pour qu'il associe automatiquement des tags à vos ressources. Cette fonctionnalité vous permet d'accorder l'accès à ces ressources de manière conditionnelle en fonction de leur niveau de sensibilité calculé. Si vous souhaitez utiliser cette fonctionnalité, vous devez d'abord effectuer les tâches décrites dans Contrôler l'accès IAM aux ressources en fonction de la sensibilité des données.

Pour générer des profils de données, vous avez besoin d'un conteneur d'agent de service et d'un agent de service à l'intérieur. Cette tâche vous permet de les créer automatiquement.

Créer une configuration d'analyse

  1. Accédez à la page Créer une configuration d'analyse.

    Accéder à la page "Créer une configuration d'analyse"

  2. Accédez à votre organisation. Dans la barre d'outils, cliquez sur le sélecteur de projet, puis sélectionnez votre organisation.

Les sections suivantes fournissent plus d'informations sur les étapes de la page Créer une configuration d'analyse. À la fin de chaque section, cliquez sur Continuer.

Sélectionner un type de détection

Sélectionnez BigQuery.

Sélectionner un niveau d'accès

Effectuez l'une des opérations suivantes :

  • Pour configurer le profilage au niveau de l'organisation, sélectionnez Analyser l'ensemble de l'organisation.
  • Pour configurer le profilage au niveau d'un dossier, sélectionnez Analyser le dossier sélectionné. Cliquez sur Parcourir, puis sélectionnez le dossier.

Gérer les planifications

Si la fréquence de profilage par défaut répond à vos besoins, vous pouvez ignorer cette section de la page Créer une configuration d'analyse.

Configurez cette section pour les raisons suivantes :

  • Pour ajuster précisément la fréquence de profilage de toutes vos données ou de certains sous-ensembles de données.
  • Pour spécifier les tables que vous ne souhaitez pas profiler.
  • Pour spécifier les tables que vous ne souhaitez pas profiler plusieurs fois.

Pour ajuster précisément la fréquence de profilage, procédez comme suit :

  1. Cliquez sur Ajouter une programmation.
  2. Dans la section Filtres, vous définissez un ou plusieurs filtres qui spécifient les tables incluses dans le champ d'application de la planification. Une table est considérée comme faisant partie du champ d'application de la programmation si elle correspond à au moins l'un des filtres définis.

    Pour configurer un filtre, spécifiez au moins l'un des éléments suivants :

    • ID de projet ou expression régulière spécifiant un ou plusieurs projets
    • ID d'un ensemble de données ou expression régulière spécifiant un ou plusieurs ensembles de données
    • ID de table ou expression régulière spécifiant une ou plusieurs tables

    Les expressions régulières doivent suivre la syntaxe RE2.

    Par exemple, si vous souhaitez inclure toutes les tables d'un projet dans le filtre, spécifiez l'ID de ce projet et laissez les deux autres champs vides.

    Pour correspondre à un filtre, une table doit répondre à toutes les expressions régulières spécifiées dans ce filtre.

    Pour ajouter d'autres filtres, cliquez sur Ajouter un filtre et répétez cette étape.

  3. Cliquez sur Fréquence.

  4. Dans la section Fréquence, indiquez si Sensitive Data Protection doit profiler les tables que vous avez définies dans vos filtres et, le cas échéant, à quelle fréquence :

    • Si vous ne souhaitez jamais que les tables soient profilées, désactivez l'option Profiler les tables.

    • Si vous souhaitez que les tables soient profilées au moins une fois, laissez l'option Profiler les tables activée.

      Dans les champs suivants de cette section, vous indiquez si le système doit reprofiler vos données et quels événements doivent déclencher une opération de reprofilage. Pour en savoir plus, consultez Fréquence de génération des profils de données.

      1. Pour En cas de modification du schéma, spécifiez la fréquence à laquelle Sensitive Data Protection doit vérifier si les schémas des tables sélectionnées ont été modifiés depuis leur dernier profilage. Seules les tables dont le schéma a été modifié seront reprofilées.
      2. Pour Types de modifications du schéma, spécifiez les types de modifications du schéma qui doivent déclencher une opération de re-profilage. Sélectionnez l'une des options suivantes :
        • Nouvelles colonnes : reprofilez les tables qui ont gagné de nouvelles colonnes.
        • Colonnes supprimées : reprofilez les tables dont des colonnes ont été supprimées.

        Par exemple, supposons que vous ayez des tables qui gagnent de nouvelles colonnes chaque jour et que vous deviez profiler leur contenu à chaque fois. Vous pouvez définir En cas de modification du schéma sur Reprofiler tous les jours et Types de modifications du schéma sur Nouvelles colonnes.

      3. Pour Lorsque la table change, indiquez la fréquence à laquelle Sensitive Data Protection doit vérifier si les tables sélectionnées ont subi des modifications depuis leur dernier profilage. Seules les tables ayant subi des modifications seront reprofilées. Les modifications de table incluent par exemple la suppression de lignes et les modifications de schéma.

        Vous devez sélectionner une valeur identique ou moins fréquente que celle que vous avez définie dans le champ En cas de modification du schéma.

      4. Pour Fréquence d'inspection des modifications apportées au modèle, indiquez si vous souhaitez que vos données soient reprofilées lorsque le modèle d'inspection associé est mis à jour et, le cas échéant, à quelle fréquence.

        Une modification de modèle d'inspection est détectée lorsque l'un des événements suivants se produit :

        • Le nom d'un modèle d'inspection change dans votre configuration d'analyse.
        • Le updateTime d'un modèle d'inspection change.

      5. Par exemple, si vous définissez un modèle d'inspection pour la région us-west1 et que vous le mettez à jour, seules les données de la région us-west1 seront reprofilées.

  5. Cliquez sur Conditions.

  6. Dans la section Conditions, spécifiez les conditions que les tables définies dans vos filtres doivent remplir pour que Sensitive Data Protection les profile. Si vous définissez des conditions minimales et la condition temporelle, Sensitive Data Protection ne profile que les tables qui répondent aux deux types de conditions.

    • Conditions minimales : ces conditions sont utiles si vous souhaitez retarder le profilage d'une table jusqu'à ce qu'elle contienne suffisamment de lignes ou qu'elle ait atteint un certain âge. Activez les conditions que vous souhaitez appliquer, puis spécifiez le nombre minimal de lignes ou la durée.
    • Condition temporelle : cette condition est utile si vous ne souhaitez jamais profiler d'anciens tableaux. Activez la condition temporelle, puis sélectionnez une date et une heure. Toute table créée à cette date ou avant est exclue du profilage.

    Exemples de conditions

    Supposons que vous ayez la configuration suivante :

    • Conditions minimales

      • Nombre minimal de lignes : 10
      • Durée minimale : 24 heures
    • Condition temporelle

      • Timestamp : 04/05/2022, 23:59

    Dans ce cas, Sensitive Data Protection exclut toutes les tables créées le 4 mai 2022 à 23h59 ou avant. Parmi les tables créées après cette date et heure, la protection des données sensibles ne profile que celles qui comportent 10 lignes ou qui ont au moins 24 heures.

  7. Dans la section Tables à profiler, sélectionnez l'une des options suivantes, en fonction des types de tables que vous souhaitez profiler :

    • Profiler toutes les tables : sélectionnez cette option si vous souhaitez que la protection des données sensibles profile tous les types de tables qui correspondent à vos filtres et conditions.

      Pour les types de tables non compatibles, la protection des données sensibles ne génère que des profils partiellement renseignés. Ces profils affichent des erreurs indiquant que les tables auxquelles ils se rapportent ne sont pas compatibles. Sélectionnez cette option si vous souhaitez afficher les profils partiels malgré les messages d'erreur.

      Lorsque la protection des données sensibles prend en charge un nouveau type de table, elle reprofile complètement les tables de ce type lors de la prochaine exécution planifiée.

    • Profiler les tables compatibles : sélectionnez cette option si vous souhaitez que Sensitive Data Protection ne profile que les tables compatibles qui correspondent à vos filtres et conditions. Les tables non compatibles ne disposeront pas de profils partiels.

    • Profiler des types de tables spécifiques : sélectionnez cette option si vous souhaitez que la protection des données sensibles profile uniquement les types de tables que vous sélectionnez. Dans la liste qui s'affiche, sélectionnez un ou plusieurs types.

      Lorsque la protection des données sensibles prend en charge un nouveau type de table, elle ne profile pas automatiquement les tables de ce type. Pour profiler les types de tables nouvellement compatibles, vous devez modifier votre configuration d'analyse et sélectionner ces types.

    Si vous ne sélectionnez aucune option, Sensitive Data Protection profile uniquement les tables BigQuery et affiche des erreurs pour les tables non compatibles.

    Le prix du profilage des données varie en fonction des types de tables profilées. Pour en savoir plus, consultez la page Tarifs du profilage de données.

  8. Cliquez sur OK.

  9. Facultatif : Pour ajouter d'autres programmations, cliquez sur Ajouter une programmation et répétez les étapes précédentes.

  10. Pour spécifier la priorité entre les planifications, réorganisez-les à l'aide des flèches vers le haut  et vers le bas .

    L'ordre des plannings indique comment les conflits entre eux sont résolus. Si une table correspond aux filtres de deux plannings différents, la fréquence de profilage de cette table est déterminée par le planning qui apparaît le plus haut dans la liste des plannings.

  11. Facultatif : Modifiez ou désactivez la programmation globale.

    Le dernier programme de la liste est le programme général. Cette programmation couvre les tables de votre champ d'application sélectionné qui ne correspondent à aucune des programmations que vous avez créées. La programmation globale suit la fréquence de profilage par défaut du système.

    • Pour ajuster la programmation par défaut, cliquez sur Modifier la programmation, puis ajustez les paramètres si nécessaire.
    • Pour empêcher Sensitive Data Protection de profiler les ressources couvertes par la programmation globale, désactivez l'option Profiler les ressources qui ne correspondent à aucune programmation personnalisée.

Sélectionner un modèle d'inspection

Selon la façon dont vous souhaitez fournir une configuration d'inspection, choisissez l'une des options suivantes. Quelle que soit l'option choisie, Sensitive Data Protection analyse vos données dans la région où elles sont stockées. Autrement dit, vos données ne quittent pas leur région d'origine.

Option 1 : Créer un modèle d'inspection

Choisissez cette option si vous souhaitez créer un modèle d'inspection dans la région global.

  1. Cliquez sur Créer un modèle d'inspection.
  2. Facultatif : Pour modifier la sélection par défaut des infoTypes, cliquez sur Gérer les infoTypes.

    Pour savoir comment gérer les infoTypes intégrés et personnalisés, consultez Gérer les infoTypes dans la consoleGoogle Cloud .

    Vous devez sélectionner au moins un infoType pour continuer.

  3. Facultatif : poursuivez la configuration du modèle d'inspection en ajoutant des ensembles de règles et en définissant un seuil de confiance. Pour en savoir plus, consultez la section Configurer la détection.

Lorsque Sensitive Data Protection crée la configuration d'analyse, il stocke ce nouveau modèle d'inspection dans la région global.

Option 2 : Utiliser un modèle d'inspection existant

Choisissez cette option si vous disposez de modèles d'inspection existants que vous souhaitez utiliser.

  1. Cliquez sur Sélectionner un modèle d'inspection existant.
  2. Saisissez le nom complet de la ressource du modèle d'inspection que vous souhaitez utiliser. Le champ Région est automatiquement renseigné avec le nom de la région dans laquelle votre modèle d'inspection est stocké.

    Le modèle d'inspection que vous saisissez doit se trouver dans la même région que les données à profiler.

    Pour respecter la résidence des données, Sensitive Data Protection n'utilise pas de modèle d'inspection en dehors de la région où il est stocké.

    Pour trouver le nom complet de ressource d'un modèle d'inspection, procédez comme suit :

    1. Accédez à la liste de vos modèles d'inspection. Cette page s'ouvre dans un nouvel onglet.

      Accéder aux modèles d'inspection

    2. Basculez vers le projet contenant le modèle d'inspection que vous souhaitez utiliser.
    3. Dans l'onglet Modèles, cliquez sur l'ID du modèle que vous souhaitez utiliser.
    4. Sur la page qui s'affiche, copiez le nom complet de la ressource du modèle. Il a le format suivant :
      projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
    5. Sur la page Créer une configuration d'analyse, dans le champ Nom du modèle, collez le nom complet de la ressource du modèle.
  3. Pour ajouter un modèle d'inspection pour une autre région, cliquez sur Ajouter un modèle d'inspection et saisissez le nom complet de la ressource du modèle. Répétez cette opération pour chaque région dans laquelle vous disposez d'un modèle d'inspection dédié.
  4. Facultatif : Ajoutez un modèle d'inspection stocké dans la région global. Sensitive Data Protection utilise automatiquement ce modèle pour les données des régions pour lesquelles vous n'avez pas de modèle d'inspection dédié.

Ajouter des actions

Cette section explique comment spécifier les actions que vous souhaitez que la protection des données sensibles effectue après le profilage d'une table. Ces actions sont utiles si vous souhaitez envoyer des insights recueillis à partir de profils de données à d'autres servicesGoogle Cloud .

Publier dans Google Security Operations

Les métriques collectées à partir des profils de données peuvent ajouter du contexte à vos résultats Google Security Operations. Le contexte supplémentaire peut vous aider à identifier les problèmes de sécurité les plus importants à résoudre.

Par exemple, si vous examinez un agent de service spécifique, Google Security Operations peut déterminer les ressources auxquelles l'agent de service a accédé et si l'une de ces ressources contient des données à sensibilité élevée.

Pour envoyer vos profils de données à votre instance Google Security Operations, activez l'option Publier dans Google Security Operations.

Si vous n'avez pas activé d'instance Google Security Operations pour votre organisation (via le produit autonome ou Security Command Center Enterprise), l'activation de cette option n'aura aucun effet.

Publier dans Security Command Center

Les résultats des profils de données fournissent du contexte lorsque vous triez et élaborez des plans de réponse pour vos résultats sur les failles et les menaces dans Security Command Center.

Avant de pouvoir utiliser cette action, Security Command Center doit être activé au niveau de l'organisation. L'activation de Security Command Center au niveau de l'organisation permet le flux de résultats provenant de services intégrés tels que la protection des données sensibles. Sensitive Data Protection est compatible avec Security Command Center dans tous les niveaux de service.

Si Security Command Center n'est pas activé au niveau de l'organisation, les résultats de Sensitive Data Protection n'apparaîtront pas dans Security Command Center. Pour en savoir plus, consultez Vérifier le niveau d'activation de Security Command Center.

Pour envoyer les résultats de vos profils de données à Security Command Center, assurez-vous que l'option Publier dans Security Command Center est activée.

Pour en savoir plus, consultez Publier des profils de données dans Security Command Center.

Enregistrer des copies des profils de données dans BigQuery

Sensitive Data Protection enregistre une copie de chaque profil de données généré dans une table BigQuery. Si vous ne fournissez pas les détails de la table de votre choix, Sensitive Data Protection crée un ensemble de données et une table dans le conteneur de l'agent de service. Par défaut, l'ensemble de données est nommé sensitive_data_protection_discovery et la table est nommée discovery_profiles.

Cette action vous permet de conserver un historique de tous vos profils générés. Cet historique peut être utile pour créer des rapports d'audit et visualiser les profils de données. Vous pouvez également charger ces informations dans d'autres systèmes.

Cette option vous permet également de regrouper tous vos profils de données dans une même vue, quelle que soit la région dans laquelle se trouvent vos données. Vous pouvez également afficher les profils de données dans la consoleGoogle Cloud , mais celle-ci n'affiche les profils que dans une seule région à la fois.

Lorsque la protection des données sensibles ne parvient pas à profiler une table, elle relance régulièrement l'opération. Pour réduire le bruit dans les données exportées, la protection des données sensibles n'exporte que les profils générés vers BigQuery.

Sensitive Data Protection commence à exporter les profils à partir du moment où vous activez cette option. Les profils générés avant l'activation de l'exportation ne sont pas enregistrés dans BigQuery.

Pour obtenir des exemples de requêtes que vous pouvez utiliser lorsque vous analysez des profils de données, consultez Analyser des profils de données.

Enregistrer un échantillon des résultats de la découverte dans BigQuery

La protection des données sensibles peut ajouter des exemples de résultats à une table BigQuery de votre choix. Les exemples de résultats représentent un sous-ensemble de tous les résultats et peuvent ne pas représenter tous les infoTypes découverts. En règle générale, le système génère environ 10 exemples de résultats par table, mais ce nombre peut varier pour chaque exécution de découverte.

Chaque résultat inclut la chaîne réelle (également appelée citation) qui a été détectée et son emplacement exact.

Cette action est utile si vous souhaitez évaluer si votre configuration d'inspection correspond correctement au type d'informations que vous souhaitez signaler comme sensibles. À l'aide des profils de données et des exemples de résultats exportés, vous pouvez exécuter des requêtes pour obtenir plus d'informations sur les éléments spécifiques signalés, les infoTypes auxquels ils correspondent, leur emplacement exact, leur niveau de sensibilité calculé et d'autres détails.

Cet exemple nécessite que les options Enregistrer des copies des profils de données dans BigQuery et Enregistrer un échantillon des résultats de la découverte dans BigQuery soient activées.

La requête suivante utilise une opération INNER JOIN à la fois sur la table des profils de données exportés et sur la table des exemples de résultats exportés. Dans le tableau qui s'affiche, chaque enregistrement indique la citation du résultat, l'infoType auquel il correspond, la ressource qui contient le résultat et le niveau de sensibilité calculé de la ressource.

SELECT
 findings_table.quote,
 findings_table.infotype.name,
 findings_table.location.container_name,
 findings_table.location.data_profile_finding_record_location.field.name AS field_name,
 profiles_table.table_profile.dataset_project_id AS project_id,
 profiles_table.table_profile.dataset_id AS dataset_id,
 profiles_table.table_profile.table_id AS table_id,
 profiles_table.table_profile.sensitivity_score AS table_sensitivity_score
 FROM
 `FINDINGS_TABLE_PROJECT_ID.FINDINGS_TABLE_DATASET_ID.FINDINGS_TABLE_ID_latest_v1` AS findings_table
INNER JOIN
 `PROFILES_TABLE_PROJECT_ID.PROFILES_TABLE_DATASET_ID.PROFILES_TABLE_ID_latest_v1` AS profiles_table
ON
 findings_table.data_profile_resource_name=profiles_table.table_profile.name

Pour enregistrer un échantillon de résultats dans une table BigQuery, procédez comme suit :

  1. Activez l'option Enregistrer un échantillon des résultats de la découverte dans BigQuery.

  2. Saisissez les détails de la table BigQuery dans laquelle vous souhaitez enregistrer les exemples de résultats.

    La table que vous spécifiez pour cette action doit être différente de celle utilisée pour l'action Enregistrer les copies des profils de données dans BigQuery.

    • Pour ID du projet, saisissez l'ID d'un projet existant dans lequel vous souhaitez exporter les résultats.

    • Pour ID de l'ensemble de données, saisissez le nom d'un ensemble de données existant dans le projet.

    • Dans le champ ID de table, saisissez le nom de la table BigQuery dans laquelle vous souhaitez enregistrer les résultats. Si cette table n'existe pas, la protection des données sensibles la crée automatiquement pour vous en utilisant le nom que vous fournissez.

Pour en savoir plus sur le contenu de chaque résultat enregistré dans la table BigQuery, consultez DataProfileFinding.

Associer des tags aux ressources

Si vous activez l'option Associer des tags aux ressources, la protection des données sensibles taguera automatiquement vos données en fonction de leur niveau de sensibilité calculé. Pour cette section, vous devez d'abord effectuer les tâches décrites dans Contrôler l'accès IAM aux ressources en fonction de la sensibilité des données.

Pour taguer automatiquement une ressource en fonction de son niveau de sensibilité calculé, procédez comme suit :

  1. Activez l'option Taguer les ressources.
  2. Pour chaque niveau de sensibilité (élevé, modéré, faible et inconnu), saisissez le chemin d'accès à la valeur du tag que vous avez créé pour le niveau de sensibilité concerné.

    Si vous ignorez un niveau de sensibilité, aucun tag n'y est associé.

  3. Pour abaisser automatiquement le niveau de risque des données d'une ressource lorsque le tag de niveau de sensibilité est présent, sélectionnez Lorsqu'un tag est appliqué à une ressource, réduire le risque des données de son profil à FAIBLE. Cette option vous permet de mesurer l'amélioration de votre niveau de sécurité et de confidentialité des données.

  4. Sélectionnez l'une des options suivantes, ou les deux :

    • Taguer une ressource lorsqu'elle est profilée pour la première fois.
    • Taguer une ressource lorsque son profil est mis à jour. Sélectionnez cette option si vous souhaitez que Sensitive Data Protection remplace la valeur du tag de niveau de sensibilité lors des analyses de découverte suivantes. Par conséquent, l'accès d'un principal à une ressource change automatiquement à mesure que le niveau de sensibilité des données calculé pour cette ressource augmente ou diminue.

      Ne sélectionnez pas cette option si vous prévoyez de mettre à jour manuellement les valeurs des libellés de niveau de sensibilité que le service de découverte a associés à vos ressources. Si vous sélectionnez cette option, Sensitive Data Protection peut écraser vos mises à jour manuelles.

Publier dans Pub/Sub

L'option Publier sur Pub/Sub vous permet d'effectuer des actions programmatiques en fonction des résultats du profilage. Vous pouvez utiliser les notifications Pub/Sub pour développer un workflow permettant d'identifier et de corriger les résultats présentant un risque ou une sensibilité importants pour les données.

Pour envoyer des notifications à un sujet Pub/Sub, procédez comme suit :

  1. Activez Publier dans Pub/Sub.

    Une liste d'options s'affiche. Chaque option décrit un événement qui déclenche l'envoi d'une notification à Pub/Sub par la protection des données sensibles.

  2. Sélectionnez les événements qui doivent déclencher une notification Pub/Sub.

    Si vous sélectionnez Envoyer une notification Pub/Sub à chaque mise à jour d'un profil, Sensitive Data Protection envoie une notification en cas de modification du niveau de sensibilité, du niveau de risque lié aux données, des infoTypes détectés, de l'accès public et d'autres métriques importantes dans le profil.

  3. Pour chaque événement que vous sélectionnez, procédez comme suit :

    1. Saisissez le nom du thème. Le nom doit respecter le format suivant :

      projects/PROJECT_ID/topics/TOPIC_ID
      

      Remplacez les éléments suivants :

      • PROJECT_ID : ID du projet associé au sujet Pub/Sub.
      • TOPIC_ID : ID du sujet Pub/Sub.
    2. Indiquez si vous souhaitez inclure le profil complet du tableau dans la notification ou uniquement le nom complet de la ressource du tableau profilé.

    3. Définissez les niveaux de sensibilité et de risque liés aux données minimaux qui doivent être atteints pour que Sensitive Data Protection envoie une notification.

    4. Indiquez si une seule ou les deux conditions de risque et de sensibilité des données doivent être remplies. Par exemple, si vous choisissez AND, les conditions de risque de données et de sensibilité doivent être remplies pour que Sensitive Data Protection envoie une notification.

Envoyer à Data Catalog sous forme de tags

Cette fonctionnalité est obsolète.

Cette action vous permet de créer des tags Data Catalog dans Dataplex Universal Catalog en fonction des insights issus des profils de données. Cette action ne s'applique qu'aux profils nouveaux et modifiés. Les profils existants qui ne sont pas mis à jour ne sont pas envoyés à Dataplex Universal Catalog.

Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif. Lorsque vous activez cette action, les tables que vous profilez sont automatiquement taguées dans Data Catalog en fonction des insights recueillis à partir des profils de données. Vous pouvez ensuite utiliser Dataplex Universal Catalog pour rechercher dans votre organisation et vos projets les tables comportant des valeurs de tag spécifiques.

Pour envoyer les profils de données à Dataplex Universal Catalog sous forme de tags Data Catalog, assurez-vous que l'option Envoyer à Dataplex sous forme de tags est activée.

Pour en savoir plus, consultez Taguer des tables dans Data Catalog en fonction des insights issus des profils de données.

Envoyer au catalogue Dataplex Universal Catalog sous forme d'aspects

Cette action vous permet d'ajouter des aspects Dataplex Universal Catalog aux tables profilées en fonction des insights issus des profils de données. Cette action ne s'applique qu'aux profils nouveaux et modifiés. Les profils existants qui ne sont pas mis à jour ne sont pas envoyés à Dataplex Universal Catalog.

Lorsque vous activez cette action, la protection des données sensibles associe l'aspect Sensitive Data Protection profile à l'entrée Dataplex Universal Catalog pour chaque table nouvelle ou mise à jour que vous profilez. Les aspects générés contiennent des insights recueillis à partir des profils de données. Vous pouvez ensuite rechercher dans votre organisation et vos projets les entrées présentant des valeurs d'aspect Sensitive Data Protection profile spécifiques.

Pour envoyer les profils de données à Dataplex Universal Catalog, assurez-vous que l'option Envoyer au catalogue Dataplex sous forme d'aspects est activée.

Pour en savoir plus, consultez Ajouter des aspects Dataplex Universal Catalog en fonction des insights issus des profils de données.

Gérer le conteneur et la facturation de l'agent de service

Dans cette section, vous spécifiez le projet à utiliser en tant que conteneur d'agent de service. Vous pouvez demander à la protection des données sensibles de créer automatiquement un projet, ou bien sélectionner un projet existant.

Que vous utilisiez un agent de service nouvellement créé ou que vous en réutilisiez un existant, assurez-vous qu'il dispose d'un accès en lecture aux données à profiler.

Créer automatiquement un projet

Si vous ne disposez pas des autorisations nécessaires pour créer un projet dans l'organisation, vous devez sélectionner un projet existant ou obtenir les autorisations requises. Pour en savoir plus sur les autorisations requises, consultez Rôles requis pour utiliser des profils de données au niveau de l'organisation ou des dossiers.

Pour créer automatiquement un projet à utiliser comme conteneur d'agent de service, procédez comme suit :

  1. Dans le champ Conteneur de l'agent de service, vérifiez l'ID de projet suggéré et modifiez-le si nécessaire.
  2. Cliquez sur Créer.
  3. Facultatif : Modifiez le nom du projet par défaut.
  4. Sélectionnez le compte à facturer pour toutes les opérations facturables associées à ce nouveau projet, y compris les opérations non liées à la découverte.

  5. Cliquez sur Créer.

Sensitive Data Protection crée le projet. L'agent de service de ce projet sera utilisé pour s'authentifier auprès de Sensitive Data Protection et d'autres API.

Sélectionner un projet existant

Pour sélectionner un projet existant comme conteneur d'agent de service, cliquez sur le champ Conteneur d'agent de service et sélectionnez le projet.

Définir l'emplacement de stockage de la configuration

Cliquez sur la liste Emplacement de la ressource, puis sélectionnez la région dans laquelle vous souhaitez stocker la configuration d'analyse. Toutes les configurations d'analyse que vous créerez ultérieurement seront également stockées à cet emplacement.

L'emplacement où vous choisissez de stocker votre configuration d'analyse n'affecte pas les données à analyser. Vos données sont analysées dans la région dans laquelle elles sont stockées. Pour en savoir plus, consultez Considérations relatives à la résidence des données.

Vérifier et créer

  1. Si vous souhaitez vous assurer que le profilage ne démarre pas automatiquement après la création de la configuration d'analyse, sélectionnez Créer une analyse en mode suspendu.

    Cette option est utile dans les cas suivants :

    • Votre administrateur Google Cloud doit toujours accorder l'accès au profilage des données à l'agent de service.
    • Vous souhaitez créer plusieurs configurations d'analyse et que certaines d'entre elles doivent remplacer d'autres.
    • Vous avez choisi d'enregistrer les profils de données dans BigQuery et vous souhaitez vous assurer que l'agent de service dispose d'un accès en écriture à la table BigQuery dans laquelle les copies des profils de données seront enregistrées.
    • Vous avez choisi d'enregistrer un échantillon des résultats de la découverte dans BigQuery et vous souhaitez vous assurer que l'agent de service dispose d'un accès en écriture à la table BigQuery dans laquelle les résultats de l'échantillon seront enregistrés.
    • Vous avez configuré des notifications Pub/Sub et vous souhaitez accorder un accès à la publication à l'agent de service.
    • Vous avez activé l'action Associer des tags à des ressources et vous devez accorder à l'agent de service l'accès au tag de niveau de sensibilité.
  2. Vérifiez vos paramètres, puis cliquez sur Créer.

    Sensitive Data Protection crée la configuration d'analyse et l'ajoute à la liste des configurations d'analyse de découverte.

Pour afficher ou gérer vos configurations d'analyse, consultez Gérer les configurations d'analyse.

Si votre agent de service dispose des rôles nécessaires pour accéder à vos données et les profiler, Sensitive Data Protection commence à analyser vos données peu de temps après la création de la configuration d'analyse ou la reprise d'une configuration mise en veille. Sinon, Sensitive Data Protection affiche une erreur lorsque vous affichez les détails de la configuration de l'analyse.

Étapes suivantes