Évoluer Dataproc sur les clusters GKE

Pour effectuer le scaling d'un cluster Dataproc sur GKE, mettez à jour la configuration de l'autoscaler des pools de nœuds associés aux rôles de pilote Spark ou d'exécutant Spark. Vous spécifiez les pools de nœuds Dataproc sur GKE et les rôles associés lorsque vous créez un cluster Dataproc sur GKE.

Définir l'autoscaling du pool de nœuds

Vous pouvez définir les limites de l'autoscaling du pool de nœuds Dataproc sur GKE lorsque vous créez un cluster virtuel Dataproc sur GKE. Si elles ne sont pas spécifiées, les pools de nœuds Dataproc sur GKE sont mis à l'échelle automatiquement avec des valeurs par défaut (dans la version GA de Dataproc sur GKE, les valeurs par défaut sont définies sur minimum = 1 et maximum = 10, qui sont susceptibles d'être modifiées). Pour obtenir des valeurs d'autoscaling du pool de nœuds minimales et maximales spécifiques, définissez-les lorsque vous créez votre cluster virtuel Dataproc sur GKE.

Mettre à jour l'autoscaling du pool de nœuds

Utilisez la commande gcloud container node-pools update GKE suivante pour modifier la configuration d'autoscaling d'un pool de nœuds Dataproc sur GKE.

gcloud container node-pools update NODE_POOL_NAME \
    --cluster=GKE_CLUSTER_NAME \
    --region=region \
    --enable-autoscaling \
    --min-nodes=min nodes (must be <= max-nodes) \
    --max-nodes=max nodes (must be >= min-nodes) \

Fonctionnement de l'autoscaling Spark

  1. Lorsqu'une tâche est envoyée, le pod du pilote est planifié pour s'exécuter sur le pool de nœuds associé au rôle de pilote Spark.
  2. Le pod du pilote appelle le planificateur GKE pour créer des pods d'exécuteur.
  3. Les pods d'exécuteur sont planifiés sur le pool de nœuds associé au rôle d'exécuteur Spark.
  4. Si les pools de nœuds ont la capacité nécessaire pour les pods, ceux-ci commencent à s'exécuter immédiatement. En cas de capacité insuffisante, l'autoscaler de cluster GKE met à l'échelle le pool de nœuds pour fournir les ressources demandées, jusqu'à la limite spécifiée par l'utilisateur. Lorsque les pools de nœuds disposent d'une capacité excédentaire, l'autoscaler de cluster GKE réduit le pool de nœuds à la limite spécifiée par l'utilisateur.