Procéder à l'autoscaling d'un cluster

Standard

Vous trouverez sur cette page la procédure à suivre pour configurer l'autoscaling de vos clusters Google Kubernetes Engine standards (GKE). Reportez-vous à la section sur l'autoscaler de cluster pour en savoir plus sur son fonctionnement.

Avec les clusters Autopilot, vous n'avez pas à vous soucier du provisionnement des nœuds, ni de la gestion des pools de nœuds, car les nœuds sont automatiquement provisionnés et font l'objet d'un scaling automatique pour répondre aux exigences de vos charges de travail.

Utiliser l'autoscaler de cluster

Dans les sections suivantes, nous expliquons comment utiliser l'autoscaler de cluster.

Créer un cluster avec autoscaling

Vous pouvez créer un cluster avec l'autoscaling activé à l'aide de Google Cloud CLI ou de Google Cloud Console.

gcloud

Pour créer un cluster avec l'autoscaling activé, utilisez l'option --enable-autoscaling et spécifiez les valeurs de --min-nodes et --max-nodes :

gcloud container clusters create CLUSTER_NAME \
    --enable-autoscaling \
    --num-nodes NUM_NODES \
    --min-nodes MIN_NODES \
    --max-nodes MAX_NODES \
    --region=COMPUTE_REGION

Remplacez les éléments suivants :

CLUSTER_NAME : nom du cluster à créer
NUM_NODES : nombre de nœuds à créer dans chaque emplacement.
MIN_NODES : nombre minimal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre minimal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-min-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
MAX_NODES : nombre maximal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre maximal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-max-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
COMPUTE_REGION : région Compute Engine du nouveau cluster. Pour les clusters zonaux, utilisez --zone=COMPUTE_ZONE.

Exemple : Création d'un cluster avec l'autoscaling des nœuds activé et le nombre minimal et maximal de nœuds

La commande suivante crée un cluster avec 90 nœuds, ou 30 nœuds dans chacune des trois zones présentes dans la région. L'autoscaling des nœuds est activé, et redimensionne le nombre de nœuds en fonction de la charge du cluster. L'autoscaler de cluster peut réduire la taille du pool de nœuds par défaut à 15 nœuds, ou augmenter sa taille jusqu'à un maximum de 50 nœuds par zone.

gcloud container clusters create my-cluster --enable-autoscaling \
    --num-nodes=30 \
    --min-nodes=15 --max-nodes=50 \
    --region=us-central

Exemple : Créer un cluster avec l'autoscaling des nœuds activé et le nombre total de nœuds

La commande suivante crée un cluster avec 30 nœuds, ou 10 nœuds dans chacune des trois zones présentes dans la région. L'autoscaling des nœuds est activé, et redimensionne le nombre de nœuds en fonction de la charge du cluster. Dans cet exemple, la taille totale du cluster peut être comprise entre 10 et 60 nœuds, quelle que soit la répartition entre les zones.

gcloud container clusters create my-cluster --enable-autoscaling \
    --num-nodes 10 \
    --region us-central1 \
    --total-min-nodes 10  --total-max-nodes 60

Console

Pour créer un cluster dans lequel l'autoscaling est activé pour le pool de nœuds par défaut, procédez comme suit :

Accédez à la page Google Kubernetes Engine dans Google Cloud Console.

Accéder à Google Kubernetes Engine
Cliquez sur Créer.
Configurez le cluster selon vos besoins.
Dans le volet de navigation, sous Pools de nœuds, cliquez sur default-pool.
Cochez la case Activer l'autoscaling.
Modifiez les valeurs des champs Nombre minimal de nœuds et Nombre maximal de nœuds selon vos besoins.
Cliquez sur Créer.

Ajouter un pool de nœuds avec autoscaling

Vous pouvez créer un pool de nœuds en activant l'autoscaling à l'aide de gcloud CLI ou de Google Cloud Console.

gcloud

Pour ajouter un pool de nœuds avec autoscaling à un cluster existant, utilisez la commande suivante :

gcloud container node-pools create POOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-autoscaling \
    --min-nodes=MIN_NODES \
    --max-nodes=MAX_NODES \
    --region=COMPUTE_REGION

Remplacez les éléments suivants :

POOL_NAME : nom du pool de nœuds souhaité.
CLUSTER_NAME : nom du cluster dans lequel le pool de nœuds est créé.
MIN_NODES : nombre minimal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre minimal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-min-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
MAX_NODES : nombre maximal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre maximal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-max-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
COMPUTE_REGION : région Compute Engine du nouveau cluster. Pour les clusters zonaux, utilisez --zone=COMPUTE_ZONE.

Exemple : Ajout d'un pool de nœuds avec autoscaling des nœuds activé

La commande suivante crée un pool de nœuds avec un autoscaling de nœud qui effectue un scaling du pool de nœuds vers un maximum de 5 nœuds et un minimum de 1 nœud :

gcloud container node-pools create my-node-pool \
    --cluster my-cluster \
    --enable-autoscaling \
    --min-nodes 1 --max-nodes 5 \
    --zone us-central1-c

Console

Pour ajouter un pool de nœuds avec autoscaling à un cluster existant, procédez comme suit :

Accédez à la page Google Kubernetes Engine dans Google Cloud Console.

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez modifier.
Cliquez sur Ajouter un pool de nœuds.
Configurez le pool de nœuds selon vos préférences.
Sous Taille, cochez la case Activer l'autoscaling.
Modifiez les valeurs des champs Nombre minimal de nœuds et Nombre maximal de nœuds selon vos besoins.
Cliquez sur Créer.

Activer l'autoscaling pour un pool de nœuds existant

Vous pouvez activer l'autoscaling pour un pool de nœuds existant à l'aide de gcloud CLI ou de Google Cloud Console.

gcloud

Pour activer l'autoscaling pour un pool de nœuds existant, utilisez la commande suivante :

gcloud container clusters update CLUSTER_NAME \
    --enable-autoscaling \
    --node-pool=POOL_NAME \
    --min-nodes=MIN_NODES \
    --max-nodes=MAX_NODES \
    --region=COMPUTE_REGION

Remplacez les éléments suivants :

CLUSTER_NAME : nom du cluster à mettre à jour.
POOL_NAME : nom du pool de nœuds souhaité. Si vous n'avez qu'un seul pool de nœuds, indiquez default-pool comme valeur.
MIN_NODES : nombre minimal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre minimal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-min-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
MAX_NODES : nombre maximal de nœuds en cas de scaling automatique pour le pool de nœuds spécifié par zone. Pour spécifier le nombre maximal de nœuds pour l'ensemble du pool de nœuds dans GKE version 1.24 ou ultérieure, utilisez --total-max-nodes. Les options --total-min-nodes et --total-max-nodes sont mutuellement exclusives avec les options --min-nodes et --max-nodes.
COMPUTE_REGION : région Compute Engine du nouveau cluster. Pour les clusters zonaux, utilisez --zone=COMPUTE_ZONE.

Console

Pour activer l'autoscaling pour un pool de nœuds existant, procédez comme suit :

Accédez à la page Google Kubernetes Engine dans Google Cloud Console.

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez modifier.
Cliquez sur l'onglet Nœuds.
Sous Pools de nœuds, cliquez sur le nom du pool de nœuds concerné, puis sur Modifier.
Sous Taille, cochez la case Activer l'autoscaling.
Modifiez les valeurs des champs Nombre minimal de nœuds et Nombre maximal de nœuds selon vos besoins.
Cliquez sur Enregistrer.

Vérifier que l'autoscaling est activé pour le pool de nœuds existant

Vérifiez que votre cluster utilise l'autoscaling avec Google Cloud CLI ou la console Google Cloud.

gcloud

Décrivez les pools de nœuds dans le cluster :

gcloud container node-pools describe NODE_POOL_NAME --cluster=CLUSTER_NAME |grep autoscaling -A 1

Remplacez les éléments suivants :

POOL_NAME : nom du nouveau pool de nœuds que vous choisissez.
CLUSTER_NAME : nom du cluster.

Si l'autoscaling est activé, la sortie ressemble à ce qui suit :

autoscaling:
  enabled: true

Console

Accédez à la page Google Kubernetes Engine dans Google Cloud Console.

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez vérifier.
Cliquez sur l'onglet Nœuds.
Sous Pools de nœuds, vérifiez l'état Autoscalling du pool de nœuds.

Créer un pool de nœuds donnant la priorité à l'utilisation des réservations inutilisées

Vous pouvez utiliser l'option --location_policy=ANY lorsque vous créez un pool de nœuds pour indiquer à l'autoscaler de cluster de donner la priorité à l'utilisation des réservations inutilisées :

gcloud container node-pools create POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location_policy=ANY

Remplacez les éléments suivants :

POOL_NAME : nom du nouveau pool de nœuds que vous choisissez.
CLUSTER_NAME : nom du cluster.

Désactiver l'autoscaling pour un pool de nœuds existant

Vous pouvez désactiver l'autoscaling pour un pool de nœuds existant à l'aide de gcloud CLI ou de Google Cloud Console.

gcloud

Pour désactiver l'autoscaling pour un pool de nœuds spécifique, utilisez l'option --no-enable-autoscaling :

gcloud container clusters update CLUSTER_NAME \
    --no-enable-autoscaling \
    --node-pool=POOL_NAME \
    --region=COMPUTE_REGION

Remplacez les éléments suivants :

CLUSTER_NAME : nom du cluster à mettre à jour.
POOL_NAME : nom du pool de nœuds souhaité.
COMPUTE_REGION : région Compute Engine du nouveau cluster. Pour les clusters zonaux, utilisez --zone=COMPUTE_ZONE.

La taille du cluster est fixée à la taille actuelle par défaut du pool de nœuds du cluster, qui peut être mise à jour manuellement.

Console

Pour désactiver l'autoscaling pour un pool de nœuds spécifique, procédez comme suit :

Accédez à la page Google Kubernetes Engine dans Google Cloud Console.

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez modifier.
Cliquez sur l'onglet Nœuds.
Sous Pools de nœuds, cliquez sur le nom du pool de nœuds concerné, puis sur Modifier.
Sous Taille, décochez la case Activer l'autoscaling.
Cliquez sur Enregistrer.

Redimensionner un pool de nœuds

Pour les clusters avec autoscaling activé, l'autoscaler de cluster redimensionne automatiquement les pools de nœuds dans les limites spécifiées par la taille minimale (--min-nodes) et la taille maximale (--max-nodes) ou la taille totale minimale (--total-min-nodes) et la taille totale maximale (--total-max-nodes). Ces options s'excluent mutuellement. Vous ne pouvez pas redimensionner manuellement un pool de nœuds en modifiant ces valeurs.

Si vous souhaitez redimensionner manuellement un pool de nœuds dans votre cluster pour lequel l'autoscaling est activé, procédez comme suit :

Désactivez l'autoscaling sur le pool de nœuds.
Redimensionnez manuellement le cluster.
Réactivez l'autoscaling en spécifiant la taille minimale et la taille maximale du pool de nœuds.

Empêcher la planification des pods sur les nœuds sélectionnés

Vous pouvez utiliser des rejets startup ou status pour empêcher la planification des pods sur les nœuds sélectionnés, selon le cas d'utilisation.

Cette fonctionnalité est disponible dans GKE 1.28 et versions ultérieures.

Rejets de start-up

Utilisez des rejets startup lorsqu'une opération doit être terminée pour que des pods puissent s'exécuter sur le nœud. Par exemple, les pods ne doivent pas s'exécuter tant que l'installation des pilotes sur le nœud n'est pas terminée.

L'autoscaler de cluster considère que les nœuds rejetés avec des rejets startup ne sont pas prêts, mais qu'ils seront pris en compte lors de la logique de scaling à la hausse, en supposant qu'ils seront prêts sous peu.

Nous vous recommandons de ne pas appliquer les rejets startup aux nœuds pendant une période prolongée. L'autoscaler de cluster peut cesser de fonctionner si un nombre important de nœuds sont rejetés avec des rejets de démarrage, ce qui signifie qu'ils ne sont pas prêts. Dans ce cas, GKE ne définit pas de scaling à la hausse du cluster, car même les nouveaux nœuds ne sont pas prêts. Par conséquent, GKE considère que ce cluster est défectueux.

Les rejets de démarrage correspondent à tous les rejets portant le préfixe startup-taint.cluster-autoscaler.kubernetes.io/.

Rejets d'état

Utilisez des rejets status lorsque GKE ne doit pas utiliser de nœud donné pour exécuter les pods.

L'autoscaler de cluster traite les nœuds rejetés avec des rejets status comme étant prêts, mais les ignore lors de la logique de scaling à la hausse. Même si le nœud de rejet est prêt, aucun pod ne doit s'exécuter. Si les pods ont besoin de plus de ressources, GKE effectue un scaling à la hausse du cluster et ignore les nœuds de rejets.

Les rejets d'état sont définis comme tous les rejets avec le préfixe status-taint.cluster-autoscaler.kubernetes.io/

Ignorer les rejets

Les rejets à ignorer sont définis comme étant tous les rejets portant le préfixe ignore-taint.cluster-autoscaler.kubernetes.io/.

Dépannage

Vérifiez si le problème que vous rencontrez est dû à l'une des limites de l'autoscaler de cluster. Sinon, consultez les informations de dépannage suivantes concernant l'autoscaler de cluster :

Le cluster n'effectue pas de scaling à la baisse

Lorsque le cluster a correctement effectué un scaling à la hausse, puis qu'il tente d'effectuer un scaling à la baisse, les nœuds sous-utilisés restent activés et empêchent le cluster d'effectuer le scaling. Cette erreur se produit pour l'une des raisons suivantes :

Des restrictions peuvent empêcher la suppression d'un nœud par l'autoscaler. GKE peut empêcher la suppression d'un nœud si celui-ci contient un pod remplissant l'une des conditions suivantes :
- Les règles d'affinité ou d'anti-affinité du pod empêchent la replanification.
- Dans les versions 1.21 et antérieures de GKE, le pod dispose d'un stockage local.
- Le pod n'est pas géré par un contrôleur tel que Deployment, StatefulSet, Job ou ReplicaSet.
Pour résoudre ce problème, configurez les règles de planification et d'éviction de l'autoscaler de cluster sur vos pods. Pour en savoir plus, consultez la section Prendre en compte la planification et l'interruption des pods.
Les pods système s'exécutent sur un nœud. Pour vérifier que vos nœuds exécutent des pods kube-system, procédez comme suit :
1. Accédez à l'explorateur de journaux dans la console Google Cloud.
  
  Accéder à l'explorateur de journaux
2. Cliquez sur Générateur de requêtes.
3. Utilisez la requête suivante pour rechercher tous les enregistrements du journal des règles de réseau :
```
  - resource.labels.location="CLUSTER_LOCATION"
  resource.labels.cluster_name="CLUSTER_NAME"
  logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fcluster-autoscaler-visibility"
  jsonPayload.noDecisionStatus.noScaleDown.nodes.node.mig.nodepool="NODE_POOL_NAME"
```
  Remplacez les éléments suivants :
  - CLUSTER_LOCATION : la région dans laquelle se trouve le cluster
  - CLUSTER_NAME : le nom du cluster
  - PROJECT_ID : ID du projet dans lequel le cluster est créé.
  - NODE_POOL_NAME : le nom de votre pool de nœuds
    
    S'il y a des pods kube-system en cours d'exécution sur votre pool de nœuds, le résultat inclut les éléments suivants :
```
"no.scale.down.node.pod.kube.system.unmovable"
```
Pour résoudre ce problème, vous devez effectuer l'une des opérations suivantes :
- Ajoutez un budget PodDisruptionBudget pour les pods kube-system. Pour en savoir plus sur l'ajout manuel d'un PodDisruptionBudget pour les pods kube-system, consultez les questions fréquentes sur l'autoscaler de cluster Kubernetes.
- Utilisez une combinaison de rejets et de tolérances de pools de nœuds pour séparer les pods kube-system des pods de votre application. Pour en savoir plus, consultez la section Provisionnement automatique des nœuds dans GKE.

Incohérence sur la taille du pool de nœuds

Le problème suivant survient lorsque vous configurez la taille du pool de nœuds :

La taille d'un pool de nœuds existant est inférieure au nombre minimal de nœuds que vous avez spécifié pour le cluster.

La liste suivante décrit les causes les plus courantes de ce comportement :

Vous avez spécifié un nouveau nombre minimal de nœuds alors que le nombre de nœuds existants est plus élevé.
Vous avez réduit manuellement le pool de nœuds ou le groupe d'instances géré sous-jacent. Cette opération manuelle a spécifié un nombre de nœuds inférieur au nombre minimal de nœuds.
Vous avez déployé des VM Spot préemptées dans le pool de nœuds.
Le pod dispose d'un stockage en local et la version du plan de contrôle GKE est antérieure à la version 1.22. Dans les clusters GKE avec la version 1.22 ou ultérieure du plan de contrôle, les pods avec stockage local ne bloquent plus le scaling à la baisse.
Le pod comporte l'annotation "cluster-autoscaler.kubernetes.io/safe-to-evict": "false".

Pour connaître les étapes de dépannage supplémentaires lors des événements de scaling à la baisse, consultez la page Impossible d'effectuer un scaling à la baisse du cluster.
Durant la phase de réduction de la capacité, l'autoscaler de cluster respecte le délai de grâce pour l'arrêt des pods, jusqu'à 10 minutes. Passé ce délai, les pods sont interrompus de force.
Vous pouvez constater une taille de pool de nœuds inférieure au nombre minimal de nœuds que vous avez spécifié pour le cluster. Ce comportement est dû au fait que l'autoscaler n'utilise le paramètre de nombre minimal de nœuds que lorsqu'il doit déterminer un scaling à la baisse. Voici la liste des causes possibles de ce comportement.

Pour résoudre ce problème, augmentez manuellement la taille du pool de nœuds à une valeur correspondant au moins au nombre minimal de nœuds. Pour en savoir plus, consultez la section Redimensionner manuellement un cluster.

Pour en savoir plus sur l'autoscaler de cluster et éviter les interruptions, consultez la section Questions fréquentes sur l'autoscaler de cluster Kubernetes :

Procéder à l'autoscaling d'un cluster

Utiliser l'autoscaler de cluster

Créer un cluster avec autoscaling

gcloud

Console

Ajouter un pool de nœuds avec autoscaling

gcloud

Console

Activer l'autoscaling pour un pool de nœuds existant

gcloud

Console

Vérifier que l'autoscaling est activé pour le pool de nœuds existant

gcloud

Console

Créer un pool de nœuds donnant la priorité à l'utilisation des réservations inutilisées

Désactiver l'autoscaling pour un pool de nœuds existant

gcloud

Console

Redimensionner un pool de nœuds

Empêcher la planification des pods sur les nœuds sélectionnés

Rejets de start-up

Rejets d'état

Ignorer les rejets

Dépannage

Le cluster n'effectue pas de scaling à la baisse

Incohérence sur la taille du pool de nœuds

Étapes suivantes