Utiliser Cloud DLP pour analyser les données BigQuery

Connaître les emplacements de vos données sensibles est souvent la première action à effectuer pour vous assurer qu'elles sont correctement sécurisées et gérées. Cette information peut réduire le risque d'exposition de détails sensibles tels que les numéros de carte de crédit, les informations médicales, les numéros de sécurité sociale, les numéros de permis de conduire, les adresses, les noms complets et les secrets d'entreprise. Une analyse périodique de vos données peut également vous aider à respecter les exigences de conformité et les bonnes pratiques au fur et à mesure de la croissance et de l'évolution de vos données. Afin de répondre aux exigences de conformité, utilisez Cloud Data Loss Prevention (Cloud DLP) pour analyser vos tables BigQuery et protéger vos données sensibles.

Cloud DLP est un service entièrement géré qui permet aux clients Google Cloud Platform d'identifier et de protéger les données sensibles à grande échelle. Cloud DLP s'appuie sur plus de 100 détecteurs prédéfinis pour identifier les modèles, les formats et les sommes de contrôle. Cloud DLP fournit également un ensemble d'outils permettant de supprimer l'identification de vos données, ce qui comprend le masquage, la tokenisation, la pseudonymisation, le décalage de date, etc., sans répliquer les données des clients.

Pour en savoir plus sur Cloud DLP, consultez la documentation associée.

Avant de commencer

  1. Familiarisez-vous avec les tarifs de Cloud DLP et la maîtrise des coûts associés à Cloud DLP.
  2. Activez l'API Cloud DLP.

    Activer l'API

  3. Assurez-vous que l'utilisateur créant vos tâches Cloud DLP dispose d'un rôle IAM Cloud DLP prédéfini approprié ou d'autorisations suffisantes pour exécuter les tâches Cloud DLP.

Analyser les données BigQuery à l'aide de la console GCP

Pour analyser les données BigQuery, créez une tâche Cloud DLP qui analyse une table. Vous pouvez analyser rapidement une table BigQuery à l'aide de l'option Analyser avec DLP de la console GCP BigQuery.

Pour analyser une table BigQuery à l'aide de Cloud DLP :

  1. Ouvrez l'UI Web de BigQuery dans la console GCP.
    Accéder à la console GCP

  2. Dans la section Ressources, développez votre projet et votre ensemble de données, puis sélectionnez la table BigQuery à analyser.

  3. Cliquez sur Exporter > Analyser avec DLP (bêta). La page de création de tâche Cloud DLP s'ouvre dans un nouvel onglet.

  4. Pour l'étape 1 : Choisir les données d'entrée, les valeurs des sections Nom et Emplacement sont générées automatiquement. De plus, la section Échantillonnage est configurée automatiquement pour exécuter un exemple d'analyse avec vos données. Vous pouvez ajuster le nombre de lignes de l'échantillon en sélectionnant Pourcentage de lignes dans le champ Limiter les lignes par. Vous pouvez également changer le nombre de lignes échantillonnées en modifiant la valeur du champ Nombre maximal de lignes.

  5. Cliquez sur Continuer.

  6. (Facultatif) Pour l'étape 2 : Configurer la détection, vous pouvez configurer les types de données à rechercher, appelés infoTypes. Vous pouvez effectuer votre sélection dans la liste des infoTypes prédéfinis ou sélectionner un modèle, le cas échéant. Pour plus d'informations sur les infoTypes, consultez la page InfoTypes et détecteurs d'infoTypes dans la documentation de Cloud DLP.

  7. Cliquez sur Continuer.

  8. (Facultatif) Pour l'étape 3 : Ajouter des actions, activez l'option Enregistrer dans BigQuery pour publier vos résultats Cloud DLP dans une table BigQuery. Si vous ne stockez pas les résultats, la tâche terminée ne contient que des statistiques sur le nombre de résultats et leurs infoTypes. L'enregistrement des résultats dans BigQuery conserve des informations détaillées sur l'emplacement exact et la fiabilité de chaque résultat.

  9. (Facultatif) Si vous avez activé l'option Enregistrer dans BigQuery, dans la section Enregistrer dans BigQuery :

    • Pour ID du projet, saisissez l'identifiant du projet dans lequel vos résultats sont stockés.
    • Pour ID de l'ensemble de données, saisissez le nom de l'ensemble de données qui stocke vos résultats.
    • (Facultatif) Pour ID de la table, entrez le nom de la table dans laquelle vos résultats sont stockés. Si aucun ID de table n'est spécifié, un nom par défaut est attribué à une nouvelle table, comme dans l'exemple suivant : dlp_googleapis_date_1234567890. Si vous spécifiez un nom de table existante, les résultats y sont ajoutés.
  10. Cliquez sur Continuer.

  11. (Facultatif) Pour l'étape 4 : Programmer, configurez une période ou une programmation en sélectionnant Spécifier la période ou Créer un déclencheur pour exécuter la tâche selon une programmation régulière.

  12. Cliquez sur Continuer.

  13. (Facultatif) Sur la page Vérifier, examinez les détails de votre tâche.

  14. Cliquez sur Créer.

  15. Une fois la tâche Cloud DLP terminée, vous êtes redirigé vers la page de détails de la tâche et vous êtes averti par e-mail. Vous pouvez afficher les résultats de l'analyse sur la page de détails de la tâche ou cliquer sur le lien de la page de détails de la tâche Cloud DLP dans l'e-mail de fin de tâche.

  16. Si vous avez choisi de publier les résultats Cloud DLP dans BigQuery, dans la page Informations sur la tâche, cliquez sur Afficher les résultats dans BigQuery pour ouvrir la table dans l'interface utilisateur Web de BigQuery. Vous pouvez ensuite interroger la table et analyser vos résultats. Pour plus d'informations sur l'interrogation de vos résultats dans BigQuery, consultez la page Interroger les résultats Cloud DLP dans BigQuery dans la documentation de Cloud DLP.

Étapes suivantes

Pour en savoir plus sur l'inspection de BigQuery et d'autres dépôts de stockage pour les données sensibles à l'aide de Cloud DLP, consultez les rubriques suivantes dans la documentation de Cloud DLP :

Si vous souhaitez masquer les données sensibles détectées par l'analyse Cloud DLP ou supprimer leur identification, consultez les pages suivantes :

Autres ressources

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…

Besoin d'aide ? Consultez notre page d'assistance.