Configurer un déploiement inter-projets

Vous pouvez configurer un déploiement inter-projets pour Dataproc Metastore afin de séparer les ressources suivantes:

  • Service Dataproc Metastore.
  • Cluster Dataproc associé au service Dataproc Metastore.
  • Réseau utilisé par le cluster Dataproc.

Avant de commencer

Rôles requis

Pour obtenir les autorisations nécessaires pour créer un cluster Dataproc Metastore et un cluster Dataproc, demandez à votre administrateur de vous attribuer les rôles IAM suivants:

  • Pour accorder le contrôle complet des ressources Dataproc Metastore : Éditeur Dataproc Metastore (roles/metastore.editor) sur le projet de métastore.

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus sur les rôles et autorisations spécifiques de Dataproc Metastore, consultez la page Gérer l'accès avec IAM.

À propos des déploiements multiprojets

Un déploiement inter-projets pour Dataproc Metastore peut inclure les configurations suivantes:

  • Deux projets:

    • Le premier projet contient le cluster Dataproc (projet de cluster).
    • Le deuxième projet contient le service Dataproc Metastore et le réseau (projet de métastore et projet de réseau).
  • Deux projets:

    • Le premier projet contient le cluster Dataproc.
    • Le deuxième projet contient le service Dataproc Metastore et le réseau (projet de métastore et projet de réseau).
  • Deux projets:

    • Le premier projet contient le cluster Dataproc et le service Dataproc Metastore (projet de cluster et projet de métastore).
    • Le projet 2 contient et le réseau (projet réseau).
  • Trois projets:

    • Le premier projet contient le cluster Dataproc (projet de cluster).
    • Le deuxième projet contient le service Dataproc Metastore (projet de métastore).
    • Le troisième projet contient le réseau (projet réseau).

Le schéma suivant présente les configurations de projet possibles.

Présentation des configurations de projet possibles lors du déploiement d'un cluster Dataproc Metastore et Dataproc

Autorisations inter-projets

Avant de configurer des autorisations multiprojets, déterminez si elles sont nécessaires pour votre configuration:

Vous devez configurer des autorisations inter-projets supplémentaires

  • Votre cluster Dataproc et le service Dataproc Metastore se trouvent dans des projets distincts.

  • Votre service et votre réseau Dataproc Metastore se trouvent dans des projets distincts.

Configurer des autorisations inter-projets

Si le projet de cluster et le projet de métastore se trouvent dans des projets distincts, accordez les rôles suivants:

  • roles/metastore.user au compte d'agent de service Dataproc du projet de cluster (contenu dans la stratégie IAM du projet de métastore). Cette configuration s'applique aux protocoles de points de terminaison Thrift et gRPC.

Si le projet réseau et le projet de métastore se trouvent dans des projets distincts, accordez les rôles suivants:

  • roles/metastore.serviceAgent à l'agent de service du projet de métastore (contenu dans la stratégie IAM du projet réseau) Cette configuration ne s'applique qu'au protocole du point de terminaison Thrift.

Console

Pour trouver le numéro de votre projet:

  1. Accédez à l'onglet Paramètres d'IAM et d'administration.

  2. Dans la liste des projets en haut de la page, sélectionnez le projet que vous souhaitez utiliser pour créer le cluster Dataproc.

  3. Notez le numéro du projet.

Configurez les autorisations:

  1. Accédez à l'onglet IAM.

  2. Dans la liste des projets en haut de la page, sélectionnez le projet de métastore.

  3. Cliquez sur Add (Ajouter).

  4. Saisissez le compte de service dans le champ Nouveaux comptes principaux.

  5. Dans le menu "Rôles", sélectionnez Dataproc Metastore > Lecteur Dataproc Metastore.

  6. Cliquez sur Add (Ajouter).

Une fois les étapes précédentes effectuées, vous pouvez créer un cluster Dataproc associé à un service Dataproc Metastore. Notez que pour ce faire, la configuration du réseau ou du sous-réseau du cluster Dataproc doit correspondre au réseau ou au sous-réseau Dataproc Metastore.

Exemple :

gcloud metastore services create SERVICE \
     --network=projects/HOST_PROJECT/global/networks/NETWORK_ID

Étapes suivantes