Vues autorisées et vues matérialisées
Ce document explique comment créer des vues autorisées et des vues matérialisées dans BigQuery.
Les vues autorisées et les vues matérialisées autorisées vous permettent de partager des résultats de requête avec des utilisateurs et des groupes particuliers sans leur donner accès aux données sources sous-jacentes. L'accès aux données est accordé à la vue ou à la vue matérialisée, et non à l'utilisateur. Vous pouvez également utiliser la requête SQL qui crée la vue ou la vue matérialisée pour limiter les colonnes et les champs que les utilisateurs peuvent interroger.
Lorsque vous créez une vue autorisée ou une vue matérialisée dans un autre ensemble de données, l'ensemble de données source et celui de la vue autorisée doivent se trouver dans le même emplacement régional.
Pour en savoir plus sur l'autorisation de toutes les vues d'un ensemble de données plutôt que d'autoriser des vues individuelles, consultez la page Ensembles de données autorisés.
Avant de commencer
Attribuez aux utilisateurs des rôles IAM (Identity and Access Management) incluant les autorisations nécessaires pour effectuer l'ensemble des tâches du présent document.
Autorisations requises
Pour créer ou mettre à jour une vue autorisée, vous devez disposer d'autorisations sur l'ensemble de données qui contient la vue et sur celui qui lui donne accès.
Autorisations sur l'ensemble de données contenant la vue
Les vues sont traitées comme des ressources de table dans BigQuery. Par conséquent, la création d'une vue nécessite les mêmes autorisations que la création d'une table. Vous devez également être autorisé à interroger les tables référencées par la requête SQL de la vue.
Pour créer une vue, vous avez besoin de l'autorisation IAM bigquery.tables.create
. Le rôle IAM prédéfini roles/bigquery.dataEditor
inclut les autorisations dont vous avez besoin pour créer une vue.
En outre, si vous disposez de l'autorisation bigquery.datasets.create
, vous pouvez créer des vues dans les ensembles de données que vous créez. Pour créer une vue pour des données qui ne vous appartiennent pas, vous devez disposer de l'autorisation bigquery.tables.getData
pour cette table.
Pour en savoir plus sur les rôles et les autorisations IAM dans BigQuery, consultez la page Rôles prédéfinis et autorisations.
Autorisations sur l'ensemble de données donnant accès à la vue
Pour mettre à jour les propriétés d'un ensemble de données, vous devez disposer des autorisations IAM suivantes :
bigquery.datasets.update
bigquery.datasets.setIamPolicy
(obligatoire uniquement lors de la mise à jour des contrôles d'accès d'un ensemble de données dans la console Google Cloud)
Le rôle IAM prédéfini roles/bigquery.dataOwner
inclut les autorisations dont vous avez besoin pour mettre à jour les propriétés d'un ensemble de données.
En outre, si vous disposez de l'autorisation bigquery.datasets.create
, vous pouvez mettre à jour les propriétés des ensembles de données que vous créez.
Pour en savoir plus sur les rôles et les autorisations IAM dans BigQuery, consultez la page Rôles prédéfinis et autorisations.
Autoriser une vue
Pour accorder l'accès en lecture à un ensemble de données, procédez comme suit :
Console
Accédez à la page BigQuery de Google Cloud Console.
Dans le volet Explorateur, développez votre projet et sélectionnez un ensemble de données.
Cliquez sur
Afficher les actions, puis sur Ouvrir.Dans le volet Informations sur l'ensemble de données, cliquez sur
Partager, puis sélectionnez Autoriser les vues.Dans le champ Autoriser la vue, saisissez le nom de la vue à autoriser.
Cliquez sur Ajouter une autorisation.
Cliquez sur Fermer.
bq
Écrivez les informations sur l'ensemble de données existant (y compris les contrôles d'accès) dans un fichier JSON à l'aide de la commande
bq show
. Si l'ensemble de données se trouve dans un projet autre que votre projet par défaut, ajoutez l'ID du projet au nom de l'ensemble de données, en respectant le format suivant :project_id:dataset
.bq show \ --format=prettyjson \ project_id:dataset > path_to_file
Où :
- project_id est l'ID de votre projet.
- dataset est le nom de votre ensemble de données ;
- path_to_file est le chemin d'accès au fichier JSON sur votre ordinateur local.
Exemples :
Saisissez la commande suivante pour écrire les contrôles d'accès pour
mydataset
dans un fichier JSON.mydataset
se trouve dans votre projet par défaut.bq show --format=prettyjson mydataset > /tmp/mydataset.json
Saisissez la commande suivante pour écrire les contrôles d'accès pour
mydataset
dans un fichier JSON.mydataset
se trouve dansmyotherproject
.bq show --format=prettyjson \ myotherproject:mydataset > /tmp/mydataset.json
Ajoutez la vue autorisée à la section "access" du fichier JSON.
Par exemple, la section d'accès du fichier JSON d'un ensemble de données ressemblerait à ceci :
{ "access": [ { "role": "READER", "specialGroup": "projectReaders" }, { "role": "WRITER", "specialGroup": "projectWriters" }, { "role": "OWNER", "specialGroup": "projectOwners" } { "role": "READER", "specialGroup": "allAuthenticatedUsers" } { "role": "READER", "domain": "[DOMAIN_NAME]" } { "role": "WRITER", "userByEmail": "[USER_EMAIL]" } { "role": "READER", "groupByEmail": "[GROUP_EMAIL]" }, { "view":{ "datasetId": "[DATASET_NAME]", "projectId": "[PROJECT_NAME]", "tableId": "[VIEW_NAME]" } } ], }
Une fois vos modifications terminées, exécutez la commande
bq update
et incluez le fichier JSON à l'aide de l'option--source
. Si l'ensemble de données se trouve dans un projet autre que votre projet par défaut, ajoutez l'ID du projet au nom de l'ensemble de données, en respectant le format suivant :project_id:dataset
.bq update \ --source path_to_file \ project_id:dataset
Où :
- path_to_file est le chemin d'accès au fichier JSON sur votre ordinateur local.
- project_id est l'ID de votre projet.
- dataset est le nom de votre ensemble de données.
Exemples :
Saisissez la commande suivante pour mettre à jour les contrôles d'accès pour
mydataset
.mydataset
se trouve dans votre projet par défaut.bq update --source /tmp/mydataset.json mydataset
Saisissez la commande suivante pour mettre à jour les contrôles d'accès pour
mydataset
.mydataset
se trouve dansmyotherproject
.bq update --source /tmp/mydataset.json myotherproject:mydataset
Pour vérifier les modifications apportées aux contrôles d'accès, saisissez à nouveau la commande
show
sans écrire les informations dans un fichier.bq show --format=prettyjson [DATASET]
ou
bq show --format=prettyjson [PROJECT_ID]:[DATASET]
API
Appelez la méthode datasets.patch
et utilisez la propriété access
pour mettre à jour vos contrôles d'accès. Pour en savoir plus, consultez la page Ensembles de données.
Comme la méthode datasets.update
remplace l'intégralité de la ressource d'ensemble de données, il est préférable d'utiliser la méthode datasets.patch
pour mettre à jour les contrôles d'accès.
Go
Avant d'essayer cet exemple, suivez les instructions de configuration pour Go du guide de démarrage rapide de BigQuery : Utiliser les bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API BigQuery pour Go.
Pour vous authentifier auprès de BigQuery, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez la page Configurer l'authentification pour les bibliothèques clientes.
Java
Avant d'essayer cet exemple, suivez les instructions de configuration pour Java du guide de démarrage rapide de BigQuery : Utiliser les bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API BigQuery pour Java.
Pour vous authentifier auprès de BigQuery, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez la page Configurer l'authentification pour les bibliothèques clientes.
Python
Avant d'essayer cet exemple, suivez les instructions de configuration pour Python du guide de démarrage rapide de BigQuery : Utiliser les bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API BigQuery pour Python.
Pour vous authentifier auprès de BigQuery, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez la page Configurer l'authentification pour les bibliothèques clientes.
Supprimer une autorisation associée à une vue
Pour supprimer une autorisation d'affichage, procédez comme suit :
Console
Accédez à la page BigQuery de Google Cloud Console.
Dans le volet Explorateur, développez votre projet et sélectionnez un ensemble de données.
Cliquez sur > Autoriser les vues.
PartageCliquez sur
Supprimer l'autorisation.Cliquez sur Fermer.
Quotas et limites
- Les vues autorisées sont soumises à des limites. Pour en savoir plus, consultez la section Limites des ensembles de données.
- Si vous supprimez une vue autorisée, la suppression de toutes les références à la vue dans le système peut prendre jusqu'à 24 heures. Pour éviter les erreurs, attendez 24 heures avant de réutiliser le nom d'une vue supprimée ou utilisez un nom unique.
Appliquer un accès de niveau ligne à l'aide d'une vue
Les vues peuvent permettre de restreindre l'accès à des colonnes (champs) spécifiques. Si vous souhaitez restreindre l'accès à des lignes individuelles de votre table, vous n'avez pas besoin de créer des vues distinctes pour chaque utilisateur ou groupe. Au lieu de cela, vous pouvez utiliser la fonction SESSION_USER()
pour renvoyer l'adresse e-mail de l'utilisateur actuel.
Pour afficher différentes lignes pour différents utilisateurs, ajoutez à votre table un champ contenant l'utilisateur autorisé à voir la ligne. Ensuite, créez une vue qui utilise la fonction SESSION_USER()
. Dans l'exemple suivant, les noms d'utilisateur sont stockés dans le champ allowed_viewer
:
SELECT COLUMN_1, COLUMN_2 FROM `dataset.view` WHERE allowed_viewer = SESSION_USER()
La limite de cette approche est que vous ne pouvez accorder l'accès qu'à un seul utilisateur à la fois. Vous pouvez contourner cette limite en faisant de allowed_viewer
un champ répété. Cette approche vous permet de fournir une liste d'utilisateurs pour chaque ligne.
Toutefois, même si vous utilisez un champ répété, le stockage des noms d'utilisateur dans la table nécessite toujours de suivre manuellement les utilisateurs individuels ayant accès à chaque ligne.
À la place, indiquez des noms de groupe dans le champ allowed_viewer
, puis créez une table distincte mappant les groupes avec les utilisateurs. La table qui mappe les groupes avec les utilisateurs possède un schéma qui stocke les noms de groupe et les noms d'utilisateur. Exemple : {group:string, user_name:string}
. Cette approche vous permet de gérer les informations sur les utilisateurs et les groupes séparément de la table contenant les données.
Si la table de mappage est nommée private.access_control
, la requête SQL utilisée pour créer la vue autorisée est :
SELECT c.customer, c.id FROM `private.customers` c INNER JOIN ( SELECT group FROM `private.access_control` WHERE SESSION_USER() = user_name) g ON c.allowed_group = g.group
Étapes suivantes
- Pour consulter un tutoriel sur la création d'une vue autorisée, consultez la page Créer une vue autorisée.
- Pour en savoir plus sur la création de vues, consultez la page Créer des vues.
- Consultez la page Créer des vues matérialisées pour en savoir plus sur la création de vues matérialisées.
- Pour en savoir plus sur l'obtention de métadonnées de vue, consultez la page Obtenir des informations sur les vues.
- Pour en savoir plus sur la gestion des vues, consultez la page Gérer les vues.
- Pour en savoir plus sur l'autorisation de toutes les vues d'un ensemble de données, consultez la page Ensembles de données autorisés.