Présentation
La gestion de l'authentification et des accès (IAM) vous permet de contrôler l'accès des utilisateurs et des groupes aux ressources du projet. Ce document met l'accent sur les autorisations IAM pertinentes pour Dataproc et sur les rôles IAM qui accordent ces autorisations.
Autorisations Dataproc
Les autorisations Dataproc permettent aux utilisateurs, y compris aux comptes de service, d'effectuer des actions sur les clusters, les tâches, les opérations et les modèles de workflow Dataproc. Par exemple, dataproc.clusters.create
permet à un utilisateur de créer des clusters Dataproc dans un projet.
En règle générale, vous n'accordez pas d'autorisations, mais des rôles, qui incluent une ou plusieurs autorisations.
Les tableaux ci-dessous répertorient les autorisations nécessaires pour appeler les API (méthodes) Dataproc. Les tables sont organisées en fonction des API associées à chaque ressource Dataproc (clusters, tâches, opérations et modèles de workflow).
Champ d'application des autorisations : le champ d'application des autorisations Dataproc répertoriées dans les tableaux suivants correspond au projet Google Cloud contenant ces autorisations (champ d'application cloud-platform
). Voir
Autorisations de compte de service
Exemples :
dataproc.clusters.create
permet de créer Clusters Dataproc dans le projet associédataproc.jobs.create
permet d'envoyer des tâches Dataproc aux clusters Dataproc dans le projet associé.dataproc.clusters.list
permet de répertorier les détails des clusters Dataproc dans le projet associé.
Autorisations requises pour les méthodes des clusters
Méthode | Autorisations requises |
---|---|
projects.regions.clusters.create 1, 2 | dataproc.clusters.create |
projects.regions.clusters.get | dataproc.clusters.get |
projects.regions.clusters.list | dataproc.clusters.list |
projects.regions.clusters.patch 1, 2, 3 | dataproc.clusters.update |
projects.regions.clusters.delete 1 | dataproc.clusters.delete |
projects.regions.clusters.start | dataproc.clusters.start |
projects.regions.clusters.stop | dataproc.clusters.stop |
projects.regions.clusters.getIamPolicy | dataproc.clusters.getiamPolicy |
projects.regions.clusters.setIamPolicy | dataproc.clusters.setiamPolicy |
Remarques :
- L'autorisation
dataproc.operations.get
est également requise pour obtenir l'état à partir de la Google Cloud CLI. - L'autorisation
dataproc.clusters.get
est également requise pour obtenir le résultat de l'opération à partir de la Google Cloud CLI. - L'autorisation
dataproc.autoscalingPolicies.use
est également requise pour activer une règle d'autoscaling sur un cluster.
Autorisations requises pour les méthodes Jobs
Méthode | Autorisations requises |
---|---|
projects.regions.jobs.submit 1, 2 | dataproc.jobs.create dataproc.clusters.use |
projects.regions.jobs.get | dataproc.jobs.get |
projects.regions.jobs.list | dataproc.jobs.list |
projects.regions.jobs.cancel 1 | dataproc.jobs.cancel |
projects.regions.jobs.patch 1 | dataproc.jobs.update |
projects.regions.jobs.delete 1 | dataproc.jobs.delete |
projects.regions.jobs.getIamPolicy | dataproc.jobs.getiamPolicy |
projects.regions.jobs.setIamPolicy | dataproc.jobs.setiamPolicy |
Remarques :
La Google Cloud CLI nécessite également
dataproc.jobs.get
autorisation pourjobs submit
,jobs wait
,jobs update
,jobs delete
, etjobs kill
.La gcloud CLI nécessite également
dataproc.clusters.get
l'autorisation d'envoyer des jobs. Pour voir un exemple de paramétrage les autorisations nécessaires pour qu'un utilisateur puisse exécutergcloud dataproc jobs submit
sur un cluster à l'aide de l'IAM précise Dataproc (consultez Envoyer des tâches avec l'IAM précise).
Autorisations requises pour les méthodes d'opération
Méthode | Autorisations requises |
---|---|
projects.regions.operations.get | dataproc.operations.get |
projects.regions.operations.list | dataproc.operations.list |
projects.regions.operations.cancel | dataproc.operations.cancel |
projects.regions.operations.delete | dataproc.operations.delete |
projects.regions.operations.getIamPolicy | dataproc.operations.getiamPolicy |
projects.regions.operations.setIamPolicy | dataproc.operations.setiamPolicy |
Autorisations requises pour les méthodes des modèles de workflow
Méthode | Autorisations requises |
---|---|
projects.regions.workflowTemplates.instantiate | dataproc.workflowTemplates.instantiate |
projects.regions.workflowTemplates.instantiateInline | dataproc.workflowTemplates.instantiateInline |
projects.regions.workflowTemplates.create | dataproc.workflowTemplates.create |
projects.regions.workflowTemplates.get | dataproc.workflowTemplates.get |
projects.regions.workflowTemplates.list | dataproc.workflowTemplates.list |
projects.regions.workflowTemplates.update | dataproc.workflowTemplates.update |
projects.regions.workflowTemplates.delete | dataproc.workflowTemplates.delete |
projects.regions.workflowTemplates.getIamPolicy | dataproc.workflowTemplates.getiamPolicy |
projects.regions.workflowTemplates.setIamPolicy | dataproc.workflowTemplates.setiamPolicy |
Notes :
Les autorisations des modèles de flux de travail sont indépendantes des autorisations de clusters et de tâches. Un utilisateur qui ne dispose pas des autorisations
create cluster
ousubmit job
peut créer et instancier un modèle de workflow.La Google Cloud CLI requiert également l'autorisation
dataproc.operations.get
pour interroger l'achèvement du workflow.L'autorisation
dataproc.operations.cancel
est requise pour annuler un workflow en cours d'exécution.
Autorisations requises pour les méthodes des règles d'autoscaling
Méthode | Autorisations requises |
---|---|
projects.regions.autoscalingPolicies.create | dataproc.autoscalingPolicies.create |
projects.regions.autoscalingPolicies.get | dataproc.autoscalingPolicies.get |
projects.regions.autoscalingPolicies.list | dataproc.autoscalingPolicies.list |
projects.regions.autoscalingPolicies.update | dataproc.autoscalingPolicies.update |
projects.regions.autoscalingPolicies.delete | dataproc.autoscalingPolicies.delete |
projects.regions.autoscalingPolicies.getIamPolicy | dataproc.autoscalingPolicies.getIamPolicy |
projects.regions.autoscalingPolicies.setIamPolicy | dataproc.autoscalingPolicies.setIamPolicy |
Notes :
- L'autorisation
dataproc.autoscalingPolicies.use
est requise pour activer une règle d'autoscaling sur un cluster avec une requête de méthodeclusters.patch
.
Autorisations requises pour les méthodes de groupes de nœuds
Méthode | Autorisations requises |
---|---|
projects.regions.nodeGroups.create | dataproc.nodeGroups.create |
projects.regions.nodeGroups.get | dataproc.nodeGroups.get |
projects.regions.nodeGroups.resize | dataproc.nodeGroups.update |
Rôles Dataproc
Les rôles IAM Dataproc regroupent une ou plusieurs autorisations.
Vous accordez des rôles à des utilisateurs ou à des groupes pour leur permettre d'effectuer des actions sur les ressources Dataproc d'un projet. Par exemple :
Lecteur Dataproc contient
Les autorisations get
et list
, qui permettent à un utilisateur d'obtenir et de répertorier
Clusters, jobs et opérations Dataproc dans un projet.
Le tableau suivant répertorie les rôles IAM et les les autorisations associées à chaque rôle.
Rôles Dataproc |
Autorisations |
Administrateur Dataproc( Contrôle complet des ressources Dataproc. |
|
Éditeur Dataproc( Fournit les autorisations nécessaires pour consulter les ressources requises pour gérer Dataproc, y compris les types de machines, les réseaux, les projets et les zones. Ressources de niveau inférieur auxquelles vous pouvez attribuer ce rôle :
|
|
Agent Dataproc Hub( Permet de gérer les ressources Dataproc. Ce rôle est destiné aux comptes de service exécutant des instances Dataproc Hub. |
|
Lecteur Dataproc( Fournit un accès en lecture seule aux ressources de Dataproc. Ressources de niveau inférieur auxquelles vous pouvez attribuer ce rôle :
|
|
Nœud de calcul Dataproc( Fournit au nœud de calcul un accès aux ressources Dataproc. Rôle destiné aux comptes de service. |
|
Remarques :
compute
autorisations sont nécessaires ou recommandées pour créer et afficher des clusters Dataproc lors de l'utilisation de la console Google Cloud ; ou à la gcloud CLI Google Cloud CLI.- Pour autoriser un utilisateur à télécharger des fichiers, accordez-lui le rôle
Storage Object Creator
(Créateur des objets de l'espace de stockage). Pour autoriser un utilisateur à afficher le résultat de la tâche, accordez-lui le rôleStorage Object Viewer
(Lecteur des objets de l'espace de stockage). - Un utilisateur doit disposer de l'autorisation
monitoring.timeSeries.list
pour pouvoir afficher les graphiques dans la console Google Cloud → Dataproc → Détails du cluster, onglet "Présentation". - Un utilisateur doit disposer de l'autorisation
compute.instances.list
pour afficher l'état de l'instance et le menu SSH de l'instance maître Console Google Cloud → Dataproc → Détails du cluster Onglet "Instances de VM". Pour en savoir plus sur les rôles Compute Engine, consultez la section Compute Engine → Rôles IAM disponibles. - Pour créer un cluster avec un compte de service spécifié par l'utilisateur, le compte en question doit disposer de toutes les autorisations accordées par le rôle
Dataproc Worker
, y compris l'accès aux buckets de préproduction et temporaires Dataproc. Veuillez indiquer tous les rôles supplémentaires nécessaires aux fonctionnalités de configuration. Pour en savoir plus, consultez la section Créer un cluster avec un compte de service de VM personnalisé.
Rôles au niveau du projet
Il est possible d'obtenir des autorisations au niveau du projet en utilisant les rôles IAM Projet. Le tableau suivant répertorie les autorisations associées Rôles IAM associés aux projets:
Rôle de projet | Autorisations |
---|---|
Lecteur de projets | Toutes les autorisations de projet pour les actions en lecture seule préservant l'état (get, list) |
Éditeur de projet | Toutes les autorisations lecteur de projet, ainsi que toutes les autorisations de projet pour les actions qui modifient l'état (créer, supprimer, mettre à jour, utiliser, annuler, arrêter, démarrer) |
Propriétaire du projet | Toutes les autorisations de l'éditeur de projet, ainsi que celles permettant de gérer le contrôle d'accès au projet (get / set IamPolicy) et de configurer la facturation du projet |
Récapitulatif des rôles IAM et des opérations Dataproc
Le tableau suivant répertorie les opérations Dataproc associées aux de projet et Dataproc.
Operation | Éditeur de projet | Lecteur de projet | Administrateur Dataproc | Éditeur Dataproc | Lecteur Dataproc |
---|---|---|---|---|---|
Obtenir/Définir des autorisations IAM Dataproc | Non | Non | Oui | Non | Non |
Créer un cluster | Oui | Non | Oui | Oui | Non |
Répertorier les clusters | Oui | Oui | Oui | Oui | Oui |
Obtenir les détails du cluster | Oui | Oui | Oui 1, 2 | Oui 1, 2 | Oui 1, 2 |
Mettre à jour le cluster | Oui | Non | Oui | Oui | Non |
Supprimer le cluster | Oui | Non | Oui | Oui | Non |
Démarrer/Arrêter le cluster | Oui | Non | Oui | Oui | Non |
Envoyer une tâche | Oui | Non | Oui 3 | Oui 3 | Non |
Répertorier des tâches | Oui | Oui | Oui | Oui | Oui |
Obtenir les détails de la tâche | Oui | Oui | Oui 4 | Oui 4 | Oui 4 |
Annuler la tâche | Oui | Non | Oui | Oui | Non |
Supprimer la tâche | Oui | Non | Oui | Oui | Non |
Répertorier les opérations | Oui | Oui | Oui | Oui | Oui |
Obtenir les détails de l'opération | Oui | Oui | Oui | Oui | Oui |
Supprimer une opération | Oui | Non | Oui | Oui | Non |
Notes :
- Le graphique de performances n'est pas disponible, à moins que l'utilisateur ne possède également un rôle doté de l'autorisation
monitoring.timeSeries.list
. - La liste des VM du cluster n'inclut pas d'informations sur l'état ni de lien SSH pour l'instance maître, à moins que l'utilisateur ne dispose également d'un rôle doté de l'autorisation
compute.instances.list
. - Pour les tâches qui importent des fichiers, l'utilisateur doit disposer du rôle
Storage Object Creator
. ou un accès en écriture à Dataproc bucket de préproduction. - Les résultats des tâches ne sont disponibles que si l'utilisateur dispose également du rôle Observateur d'objets de stockage ou s'il dispose d'un accès en lecture au compartiment de transfert pour le projet.
Comptes de service
Lorsque vous appelez des API Dataproc pour effectuer des actions dans un projet, comme la création d'instances de VM, Dataproc effectue les actions à l'aide d'un compte de service disposant des autorisations nécessaires effectuer les actions. Pour en savoir plus, consultez la section Comptes de service Dataproc.
Gestion de l'IAM
Vous pouvez obtenir et définir des stratégies IAM à l'aide de la console Google Cloud, de l'API IAM ou de la Google Cloud CLI.
- Pour Google Cloud Console, consultez la section Contrôle des accès à l'aide de la console Google Cloud.
- Pour l'API, consultez Contrôle des accès à l'aide de l'API.
- Pour Google Cloud CLI, consultez Contrôle des accès à l'aide de Google Cloud CLI.
Étape suivante
- Apprenez-en plus sur les comptes principaux et les rôles Dataproc.
- En savoir plus sur l'IAM précise Dataproc
- Apprenez-en plus sur IAM.
- En savoir plus sur les comptes de service dans Dataproc