Présentation de la gouvernance des données dans BigQuery

Ce document présente la gouvernance des données BigQuery et explique comment utiliser les fonctionnalités de BigQuery pour mettre en œuvre et appliquer des règles de gouvernance des données BigQuery. Pour obtenir une présentation plus complète de la gouvernance des données dans Google Cloud, consultez la page Qu'est-ce que la gouvernance des données ?

La gouvernance des données est la gestion de la sécurité et de la qualité des données tout au long de leur cycle de vie, afin de garantir que l'accès et la précision sont conformes aux règles et réglementations organisationnelles. Ces priorités de gouvernance des données peuvent être divisées en trois catégories :

Les sections suivantes définissent ces catégories de gouvernance des données, expliquent comment les fonctionnalités de BigQuery les prennent en charge et recommandent les étapes suivantes.

Contrôle des accès

La gestion de l'accès aux données consiste à définir, appliquer et surveiller les règles et les stratégies régissant l'accès aux données. La gestion des accès garantit que les données ne sont accessibles qu'aux personnes autorisées à y accéder. BigQuery fournit les fonctionnalités suivantes pour vous aider à accéder aux données :

  • Identity and Access Management (IAM). Cloud IAM vous permet de contrôler qui a accès à vos ressources BigQuery, telles que des projets, des ensembles de données, des tables et des vues. Vous pouvez attribuer des rôles IAM aux utilisateurs, aux groupes et aux comptes de service. Ces rôles définissent ce qu'ils peuvent faire avec vos ressources.
  • Contrôles des accès au niveau des colonnes et Contrôles des accès au niveau des lignes. Les contrôles d'accès au niveau des colonnes et des lignes vous permettent de limiter l'accès à des colonnes et aux lignes spécifiques d'une table, en fonction des attributs utilisateur ou des valeurs des données. Ce contrôle vous permet de mettre en œuvre un accès précis afin de protéger les données sensibles contre tout accès non autorisé.
  • Gestion des transferts de données. VPC Service Controls vous permet de créer des périmètres autour des ressources Google Cloud et de contrôler l'accès à ces ressources en fonction des règles de votre organisation.
  • Journaux d'audit. Les journaux d'audit fournissent un enregistrement détaillé de l'activité des utilisateurs et des événements système dans votre organisation. Ces journaux vous aident à appliquer des règles de gouvernance des données et à identifier les risques de sécurité potentiels.

Étapes suivantes pour le contrôle des accès

Le tableau suivant décrit les prochaines étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités de contrôle des accès :

Niveau d'expérience Parcours de formation
Nouveaux utilisateurs cloud
Utilisateurs cloud expérimentés

Intendance des données

L'intendance des données permet de protéger les données sensibles en les catégorisant, en les masquant, ou en les chiffrant de manière appropriée lors de l'interrogation, du transit ou du stockage. Cette approche améliore la protection des données et l'organisation. BigQuery fournit les fonctionnalités suivantes pour vous aider à gérer les données :

  • Masquage des données. Le masquage des données vous permet de masquer les données sensibles d'une table tout en autorisant les utilisateurs autorisés à accéder aux données environnantes. Cela peut également masquer les données correspondant à des modèles de données sensibles afin d'éviter toute divulgation accidentelle de données.
  • Chiffrement. BigQuery chiffre automatiquement toutes les données au repos et en transit, tout en vous permettant de personnaliser vos paramètres de chiffrement afin de répondre à vos besoins et exigences spécifiques.
  • Gestion des métadonnées. La gestion des métadonnées vous permet de taguer des ressources, ce qui facilite la recherche, l'organisation et la catégorisation des données.

Étapes suivantes pour l'intendance des données

Le tableau suivant décrit les prochaines étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités d'intendance des données :

Niveau d'expérience Parcours de formation
Nouveaux utilisateurs cloud
Utilisateurs cloud expérimentés

Qualité des données

La gestion de la qualité des données consiste à tracer la traçabilité des données et à s'assurer qu'elles répondent à vos normes de précision, d'exhaustivité et de cohérence. BigQuery fournit les fonctionnalités suivantes pour vous aider à améliorer la qualité des données :

  • Traçabilité des données. La traçabilité des données vous permet de suivre le flux de vos données au fil du temps, en fournissant des insights sur leur origine, leur évolution dans le temps et leur destination finale dans votre système.
  • Analyses du profil de données. Les analyses de profils de données vous permettent d'analyser les caractéristiques statistiques de vos données, telles que les valeurs moyennes et uniques.
  • Analyses de la qualité des données. Les analyses de la qualité des données vous permettent de vérifier des données, de les valider par rapport à des règles définies et de résoudre les problèmes de qualité des données.

Étapes suivantes pour la qualité des données

Le tableau suivant décrit les étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités d'accès à la qualité des données :

Niveau d'expérience Parcours de formation
Nouveaux utilisateurs cloud
Utilisateurs cloud expérimentés

Étapes suivantes