Cette page a été traduite par l'API Cloud Translation.

Contrôler les attributs de nœud avec autoscaling à l'aide de ComputeClasses personnalisées

Autopilot Standard

Cette page explique comment contrôler l'infrastructure de calcul et le comportement d'autoscaling des clusters Google Kubernetes Engine (GKE) en fonction des besoins spécifiques de vos charges de travail à l'aide de ComputeClasses personnalisées. Vous devez déjà connaître le concept de ComputeClasses personnalisées. Pour en savoir plus, consultez À propos des ComputeClasses personnalisées.

Cette page s'adresse aux administrateurs de plate-forme qui souhaitent définir de manière déclarative des profils d'autoscaling pour les nœuds, et aux opérateurs de cluster qui souhaitent exécuter leurs charges de travail sur des ComputeClasses spécifiques.

À propos des ComputeClasses personnalisées

Les ComputeClasses personnalisées sont des ressources personnalisées Kubernetes qui vous permettent de définir des priorités que GKE doit suivre lors du provisionnement de nœuds pour exécuter vos charges de travail. Vous pouvez utiliser une ComputeClass personnalisée pour effectuer les opérations suivantes :

Fournissez à GKE un ensemble de priorités à suivre séquentiellement lors du provisionnement des nœuds, chacun avec des paramètres spécifiques tels qu'une série de machines Compute Engine ou une capacité de ressources minimale.
Définissez des seuils et des paramètres d'autoscaling pour supprimer les nœuds sous-utilisés et consolider efficacement les charges de travail sur la capacité de calcul existante.
Indiquez à GKE de remplacer automatiquement les configurations de nœuds "moins préférées" par des configurations de nœuds "plus préférées" pour des performances de charge de travail optimales.

Pour comprendre toutes les options de configuration et leur interaction entre elles, ainsi qu'avec les modes GKE Autopilot et GKE Standard, consultez À propos des ComputeClasses personnalisées.

Tarifs

La ressource personnalisée ComputeClass est fournie sans frais supplémentaires dans GKE. Les considérations tarifaires suivantes s'appliquent :

Mode GKE Autopilot : vous êtes facturé selon le mode de facturation basé sur les nœuds. Pour en savoir plus, consultez la page Tarifs du mode Autopilot.
Mode GKE Standard : consultez les tarifs du mode Standard.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

Activez l'API Google Kubernetes Engine.

Activer l'API Google Kubernetes Engine

Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé gcloud CLI, assurez-vous de disposer de la dernière version en exécutant la commande gcloud components update.
Remarque : Pour les installations de gcloud CLI existantes, veillez à définir la propriété compute/region. Si vous utilisez principalement des clusters zonaux, définissez plutôt compute/zone. En définissant un emplacement par défaut, vous pouvez éviter les erreurs gcloud CLI telles que celle-ci : One of [--zone, --region] must be supplied: Please specify location. Vous devrez peut-être spécifier l'emplacement dans certaines commandes si l'emplacement de votre cluster diffère de celui par défaut que vous avez défini.

Assurez-vous de disposer d'un cluster GKE existant exécutant la version 1.30.3-gke.1451000 ou ultérieure. Pour en savoir plus, consultez Créer un cluster Autopilot.
Si vous utilisez un cluster en mode Standard, assurez-vous d'avoir au moins un pool de nœuds avec l'autoscaling activé ou que votre cluster utilise le provisionnement automatique des nœuds.

Exemple de scénario pour les ComputeClasses

Cette page présente un exemple de scénario pour lequel vous définissez une classe de calcul personnalisée. En pratique, vous devez tenir compte des exigences spécifiques de vos charges de travail et de votre organisation, et définir des ComputeClasses qui répondent à ces exigences. Pour obtenir une description complète de toutes les options de ComputeClasses et des considérations spéciales, consultez À propos des ComputeClasses personnalisées.

Considérons par exemple le scénario suivant :

Votre objectif est d'optimiser les coûts d'exécution de vos charges de travail.
Vos charges de travail sont tolérantes aux pannes et ne nécessitent pas d'arrêt progressif ni de durée d'exécution prolongée.
Vos charges de travail ont besoin d'au moins 64 vCPU pour fonctionner de manière optimale.
Vous êtes limité à la série de machines N4 de Compute Engine.

Sur la base de l'exemple de scénario, vous décidez que vous souhaitez une ComputeClass effectuant les opérations suivantes :

Priorise les nœuds Spot N4 disposant d'au moins 64 vCPU
Permet à GKE de revenir à n'importe quel nœud spot N4, quelle que soit la capacité de calcul
Si aucun nœud Spot N4 n'est disponible, autorise GKE à utiliser des nœuds N4 à la demande.
Indique à GKE de déplacer vos charges de travail vers des nœuds Spot dès qu'ils sont à nouveau disponibles.

Configurer une ComputeClass en mode Autopilot

Dans GKE Autopilot, vous définissez une ComputeClass, la déployez sur le cluster et interrogez cette ComputeClass dans vos charges de travail. GKE effectue pour vous toutes les étapes de configuration des nœuds, comme l'application de libellés et de rejets.

Enregistrez le manifeste suivant sous le nom compute-class.yaml :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true
  nodePoolAutoCreation:
    enabled: true

Configurer une ComputeClass en mode Standard

Dans les clusters en mode GKE Standard, vous définissez une classe de calcul, après quoi vous devrez peut-être effectuer une configuration manuelle pour vous assurer que les pods de votre ComputeClass sont planifiés comme prévu. La configuration manuelle varie selon que vos pools de nœuds sont automatiquement provisionnés ou non, comme suit :

Pools de nœuds gérés par provisionnement automatique des nœuds : aucune configuration manuelle n'est requise. Le provisionnement automatique des nœuds effectue automatiquement les étapes de configuration de ComputeClass à votre place. Pour en savoir plus, consultez Provisionnement automatique des nœuds et ComputeClasses.
Pools de nœuds créés manuellement : une configuration manuelle est requise. Vous devez ajouter des étiquettes de nœuds et des rejets de nœuds à vos pools de nœuds créés manuellement pour associer les nœuds à une ComputeClass spécifique. Pour en savoir plus, consultez Configurer des pools de nœuds créés manuellement pour une classe de calcul.

Utiliser des ComputeClasses avec des pools de nœuds créés manuellement

Cette section explique comment définir une ComputeClass dans un cluster qui n'utilise que des pools de nœuds créés manuellement.

Enregistrez le manifeste suivant sous le nom compute-class.yaml :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true

Créez un pool de nœuds avec autoscaling qui utilise des VM Spot et associez-le à la ComputeClass :

gcloud container node-pools create cost-optimized-pool \
    --location=LOCATION \
    --cluster=CLUSTER_NAME \
    --machine-type=n4-standard-64 \
    --spot \
    --enable-autoscaling \
    --max-nodes=9 \
    --node-labels="cloud.google.com/compute-class=cost-optimized" \
    --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"

Remplacez les éléments suivants :

LOCATION : emplacement de votre cluster.
CLUSTER_NAME : nom de votre cluster existant.

Créez un pool de nœuds avec autoscaling avec des VM à la demande et associez-le à la ComputeClass :

gcloud container node-pools create on-demand-pool \
    --location=LOCATION \
    --cluster=CLUSTER_NAME \
    --machine-type=n4-standard-64 \
    --enable-autoscaling \
    --max-nodes=9 \
    --num-nodes=0 \
    --node-labels="cloud.google.com/compute-class=cost-optimized" \
    --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"

Lorsque vous déployez des pods qui nécessitent cette ComputeClass et que de nouveaux nœuds doivent être créés, GKE donne la priorité à la création de nœuds dans le pool de nœuds cost-optimized-pool. Si de nouveaux nœuds ne peuvent pas être créés, GKE crée des nœuds dans le pool de nœuds on-demand-pool.

Pour en savoir plus sur la façon dont les pools de nœuds créés manuellement interagissent avec les ComputeClasses personnalisées, consultez Configurer des pools de nœuds créés manuellement pour une classe de calcul.

Utiliser des ComputeClasses avec des pools de nœuds provisionnés automatiquement

Cette section explique comment définir une ComputeClass dans un cluster qui utilise le provisionnement automatique des nœuds.

Enregistrez le manifeste suivant sous le nom compute-class.yaml :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true
  nodePoolAutoCreation:
    enabled: true

Lorsque vous déployez des pods qui nécessitent cette ComputeClass et que de nouveaux nœuds doivent être créés, GKE donne la priorité à la création de nœuds dans les éléments de l'ordre du champ priorities. Si nécessaire, GKE crée des pools de nœuds qui répondent aux exigences matérielles de la ComputeClass.

Vous pouvez également spécifier un type de machine personnalisé précis dans vos priorités. L'utilisation de types de machines personnalisés nécessite GKE version 1.33.2-gke.1111000 ou ultérieure. L'exemple suivant configure une ComputeClass qui donne la priorité aux VM Spot pour le type de machine personnalisé n4-custom-8-20480 et qui revient aux VM à la demande du même type si la capacité Spot n'est pas disponible :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: custom-machine-type
spec:
  priorities:
  - machineType: n4-custom-8-20480
    spot: true
  - machineType: n4-custom-8-20480
    spot: false
  nodePoolAutoCreation:
    enabled: true

Pour en savoir plus sur le fonctionnement du provisionnement automatique des nœuds avec des classes de calcul personnalisées, consultez Provisionnement automatique des nœuds et ComputeClasses.

Personnaliser les seuils d'autoscaling pour la consolidation des nœuds

Par défaut, GKE supprime les nœuds sous-utilisés et replanifie vos charges de travail sur d'autres nœuds disponibles. Vous pouvez personnaliser davantage les seuils et le délai après lequel un nœud peut être supprimé à l'aide du champ autoscalingPolicy dans la définition ComputeClass, comme dans l'exemple suivant :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true
  autoscalingPolicy:
    consolidationDelayMinutes : 5
    consolidationThreshold    : 70

Dans cet exemple, un nœud devient candidat à la suppression s'il est sous-utilisé à 70 % de sa capacité de processeur et de mémoire disponibles pendant plus de cinq minutes. Pour obtenir la liste des paramètres disponibles, consultez Définir les paramètres d'autoscaling pour la consolidation des nœuds.

Déployer une ComputeClass dans un cluster

Après avoir défini une ComputeClass, déployez-la sur le cluster :

kubectl apply -f compute-class.yaml

Cette ComputeClass est prête à être utilisée dans le cluster. Vous pouvez demander la classe de calcul dans les spécifications du pod ou, éventuellement, la définir comme ComputeClass par défaut dans un espace de noms spécifique.

Demander une ComputeClass dans une charge de travail

Pour demander une ComputeClass dans une charge de travail, ajoutez un sélecteur de nœud pour cette classe de calcul dans votre fichier manifeste.

Enregistrez le manifeste suivant sous le nom cc-workload.yaml :

apiVersion: apps/v1
kind: Deployment
metadata:
  name: custom-workload
spec:
  replicas: 2
  selector:
    matchLabels:
      app: custom-workload
  template:
    metadata:
      labels:
        app: custom-workload
    spec:
      nodeSelector:
        cloud.google.com/compute-class: cost-optimized
      containers:
      - name: test
        image: gcr.io/google_containers/pause
        resources:
          requests:
            cpu: 1.5
            memory: "4Gi"

Déployer la charge de travail :
```
kubectl apply -f cc-workload.yaml
```

Lorsque vous déployez cette charge de travail, GKE ajoute automatiquement une tolérance aux pods qui correspond au rejet de nœud pour la ComputeClass demandée. Cette tolérance garantit que seuls les pods qui demandent la classe de calcul s'exécutent sur les nœuds ComputeClass.

Mettre à jour une ComputeClass déployée

Pour mettre à jour une ComputeClass déployée, modifiez le fichier manifeste YAML de la ComputeClass. Déployez ensuite le fichier manifeste modifié en exécutant la commande suivante :

kubectl apply -f PATH_TO_FILE

Remplacez PATH_TO_FILE par le chemin d'accès à votre fichier manifeste modifié. Assurez-vous que la valeur du champ name reste inchangée.

Lorsque vous déployez votre ComputeClass mise à jour, GKE utilise votre configuration mise à jour pour créer des nœuds. GKE ne modifie aucun nœud existant avec votre configuration mise à jour.

Au fil du temps, GKE peut déplacer les pods existants vers des nœuds qui utilisent votre configuration mise à jour si la ComputeClass utilise la migration active et si les pods existants sont éligibles à la migration.

Contrôler les attributs de nœud avec autoscaling à l'aide de ComputeClasses personnalisées Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

À propos des ComputeClasses personnalisées

Tarifs

Avant de commencer

Exemple de scénario pour les ComputeClasses

Configurer une ComputeClass en mode Autopilot

Configurer une ComputeClass en mode Standard

Utiliser des ComputeClasses avec des pools de nœuds créés manuellement

Utiliser des ComputeClasses avec des pools de nœuds provisionnés automatiquement

Personnaliser les seuils d'autoscaling pour la consolidation des nœuds

Déployer une ComputeClass dans un cluster

Demander une ComputeClass dans une charge de travail

Mettre à jour une ComputeClass déployée

Étapes suivantes

Contrôler les attributs de nœud avec autoscaling à l'aide de ComputeClasses personnalisées