Présentation de la gouvernance des données dans BigQuery

Ce document présente la gouvernance des données BigQuery et explique comment utiliser les fonctionnalités de BigQuery pour mettre en œuvre et appliquer des règles de gouvernance des données BigQuery. Pour obtenir une présentation plus complète de la gouvernance des données dans Google Cloud, consultez la page Qu'est-ce que la gouvernance des données ?

La gouvernance des données est la gestion de la sécurité et de la qualité des données tout au long de leur cycle de vie, afin de garantir que l'accès et la précision sont conformes aux règles et réglementations organisationnelles. Ces priorités de gouvernance des données peuvent être divisées en trois catégories :

Contrôle des accès
Intendance des données
Qualité des données

Les sections suivantes définissent ces catégories de gouvernance des données, expliquent comment les fonctionnalités de BigQuery les prennent en charge et recommandent les étapes suivantes.

Contrôle des accès

La gestion de l'accès aux données consiste à définir, appliquer et surveiller les règles et les stratégies régissant l'accès aux données. La gestion des accès garantit que les données ne sont accessibles qu'aux personnes autorisées à y accéder. BigQuery fournit les fonctionnalités suivantes pour vous aider à accéder aux données :

Identity and Access Management (IAM). Cloud IAM vous permet de contrôler qui a accès à vos ressources BigQuery, telles que des projets, des ensembles de données, des tables et des vues. Vous pouvez attribuer des rôles IAM aux utilisateurs, aux groupes et aux comptes de service. Ces rôles définissent ce qu'ils peuvent faire avec vos ressources.
Contrôles des accès au niveau des colonnes et Contrôles des accès au niveau des lignes. Les contrôles d'accès au niveau des colonnes et des lignes vous permettent de limiter l'accès à des colonnes et aux lignes spécifiques d'une table, en fonction des attributs utilisateur ou des valeurs des données. Ce contrôle vous permet de mettre en œuvre un accès précis afin de protéger les données sensibles contre tout accès non autorisé.
Gestion des transferts de données. VPC Service Controls vous permet de créer des périmètres autour des ressources Google Cloud et de contrôler l'accès à ces ressources en fonction des règles de votre organisation.
Journaux d'audit. Les journaux d'audit fournissent un enregistrement détaillé de l'activité des utilisateurs et des événements système dans votre organisation. Ces journaux vous aident à appliquer des règles de gouvernance des données et à identifier les risques de sécurité potentiels.

Étapes suivantes pour le contrôle des accès

Le tableau suivant décrit les prochaines étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités de contrôle des accès :

Niveau d'expérience	Parcours de formation
Nouveaux utilisateurs cloud	Examinez les rôles prédéfinis dans BigQuery et envisagez d'attribuer ces rôles en suivant le principe du moindre privilège.
Utilisateurs cloud expérimentés	Pour plus de flexibilité et de précision dans la gestion de vos autorisations, envisagez de créer des rôles personnalisés correspondant à vos besoins. Ajoutez des contrôles au niveau des lignes et des colonnes pour vous aider à contrôler l'accès à des lignes et des colonnes spécifiques de vos tables. Établissez un périmètre d'accès autour de vos ressources Google Cloud en configurant VPC Service Controls.

Niveau d'expérience

Parcours de formation

Nouveaux utilisateurs cloud

Examinez les rôles prédéfinis dans BigQuery et envisagez d'attribuer ces rôles en suivant le principe du moindre privilège.

Utilisateurs cloud expérimentés

Pour plus de flexibilité et de précision dans la gestion de vos autorisations, envisagez de créer des rôles personnalisés correspondant à vos besoins.
Ajoutez des contrôles au niveau des lignes et des colonnes pour vous aider à contrôler l'accès à des lignes et des colonnes spécifiques de vos tables.
Établissez un périmètre d'accès autour de vos ressources Google Cloud en configurant VPC Service Controls.

Intendance des données

L'intendance des données permet de protéger les données sensibles en les catégorisant, en les masquant, ou en les chiffrant de manière appropriée lors de l'interrogation, du transit ou du stockage. Cette approche améliore la protection des données et l'organisation. BigQuery fournit les fonctionnalités suivantes pour vous aider à gérer les données :

Masquage des données. Le masquage des données vous permet de masquer les données sensibles d'une table tout en autorisant les utilisateurs autorisés à accéder aux données environnantes. Cela peut également masquer les données correspondant à des modèles de données sensibles afin d'éviter toute divulgation accidentelle de données.
Chiffrement. BigQuery chiffre automatiquement toutes les données au repos et en transit, tout en vous permettant de personnaliser vos paramètres de chiffrement afin de répondre à vos besoins et exigences spécifiques.
Gestion des métadonnées. La gestion des métadonnées vous permet de taguer des ressources, ce qui facilite la recherche, l'organisation et la catégorisation des données.

Étapes suivantes pour l'intendance des données

Le tableau suivant décrit les prochaines étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités d'intendance des données :

Niveau d'expérience	Parcours de formation
Nouveaux utilisateurs cloud	Découvrez comment Google chiffre vos données au repos et en transit par défaut.
Utilisateurs cloud expérimentés	Ajoutez un masquage des données au niveau des colonnes à votre table afin de faciliter le partage d'informations via votre organisation sans révéler de données sensibles. Utilisez la protection des données sensibles pour rechercher des informations sensibles et à haut risque, telles que des informations personnelles, financières et médicales.

Qualité des données

La gestion de la qualité des données consiste à tracer la traçabilité des données et à s'assurer qu'elles répondent à vos normes de précision, d'exhaustivité et de cohérence. BigQuery fournit les fonctionnalités suivantes pour vous aider à améliorer la qualité des données :

Traçabilité des données. La traçabilité des données vous permet de suivre le flux de vos données au fil du temps, en fournissant des insights sur leur origine, leur évolution dans le temps et leur destination finale dans votre système.
Analyses du profil de données. Les analyses de profils de données vous permettent d'analyser les caractéristiques statistiques de vos données, telles que les valeurs moyennes et uniques.
Analyses de la qualité des données. Les analyses de la qualité des données vous permettent de vérifier des données, de les valider par rapport à des règles définies et de résoudre les problèmes de qualité des données.

Étapes suivantes pour la qualité des données

Le tableau suivant décrit les étapes que vous pouvez suivre pour en savoir plus sur les fonctionnalités d'accès à la qualité des données :

Niveau d'expérience	Parcours de formation
Nouveaux utilisateurs cloud	Exécutez une analyse de profil de données pour obtenir des informations sur vos données, y compris les limites ou les moyennes.
Utilisateurs cloud expérimentés	Activez la traçabilité des données dans votre projet BigQuery pour enregistrer automatiquement les informations de traçabilité des opérations BigQuery, telles que la charge, la copie et les modifications de données. Configurez une analyse de la qualité des données récurrente pour vous avertir des problèmes potentiels liés aux données avec les règles d'analyse prédéfinies. Configurez des règles de données personnalisées pour vos analyses de la qualité des données afin que celles-ci soient adaptées à vos besoins spécifiques.

Niveau d'expérience

Parcours de formation

Nouveaux utilisateurs cloud

Exécutez une analyse de profil de données pour obtenir des informations sur vos données, y compris les limites ou les moyennes.

Utilisateurs cloud expérimentés

Activez la traçabilité des données dans votre projet BigQuery pour enregistrer automatiquement les informations de traçabilité des opérations BigQuery, telles que la charge, la copie et les modifications de données.
Configurez une analyse de la qualité des données récurrente pour vous avertir des problèmes potentiels liés aux données avec les règles d'analyse prédéfinies.
Configurez des règles de données personnalisées pour vos analyses de la qualité des données afin que celles-ci soient adaptées à vos besoins spécifiques.

Étapes suivantes

En savoir plus sur l'authentification chez Google.
Découvrez la suppression de données sur Google Cloud.
Explorez les bonnes pratiques IAM.
Découvrez la hiérarchie des ressources sur Google Cloud.
En savoir plus sur IAM sur Google Cloud.