Cette page a été traduite par l'API Cloud Translation.

Effectuer un scaling des requêtes et limites de ressources de conteneurs

Cette page explique comment analyser et ajuster les demandes de ressources de processeur et de mémoire d'un conteneur dans Google Kubernetes Engine (GKE) à l'aide de l'autoscaling de pods verticaux.

Vous pouvez faire évoluer les ressources de conteneur manuellement via la console Google Cloud , analyser les ressources à l'aide d'un objet VerticalPodAutoscaler ou configurer le scaling automatique à l'aide de l'autoscaling de pods vertical.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

Activez l'API Google Kubernetes Engine.

Activer l'API Google Kubernetes Engine

Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé la gcloud CLI, obtenez la dernière version en exécutant la commande gcloud components update. Il est possible que les versions antérieures de gcloud CLI ne permettent pas d'exécuter les commandes de ce document.
Remarque : Pour les installations de la gcloud CLI existantes, veillez à définir la propriété compute/region. Si vous utilisez principalement des clusters zonaux, définissez plutôt compute/zone. En définissant un emplacement par défaut, vous pouvez éviter les erreurs gcloud CLI de ce type : One of [--zone, --region] must be supplied: Please specify location. Vous devrez peut-être spécifier l'emplacement dans certaines commandes si celui de votre cluster diffère de l'emplacement par défaut que vous avez défini.

Analyser les demandes de ressources

L'autoscaler de pods vertical analyse automatiquement vos conteneurs et fournit des demandes de ressources suggérées. Vous pouvez afficher ces demandes de ressources à l'aide de la consoleGoogle Cloud , de Cloud Monitoring ou de Google Cloud CLI.

Console

Pour afficher les demandes de ressources suggérées dans la console Google Cloud , vous devez déployer une charge de travail existante datant d'au moins 24 heures. Certaines suggestions peuvent ne pas être disponibles ou pertinentes pour certaines charges de travail, telles que celles créées au cours des dernières 24 heures, les pods autonomes et les applications écrites en Java.

Accédez à la page Charges de travail dans la console Google Cloud .

Accéder à la page Charges de travail
Dans la liste des charges de travail, cliquez sur le nom de la charge de travail que vous souhaitez faire évoluer.
Cliquez sur Actions > Effectuer le scaling > Modifier les demandes de ressources.

La section "Analyser les données d'utilisation des ressources" affiche l'historique des données d'utilisation que le contrôleur de l'autoscaler de pods vertical a analysé pour créer les demandes de ressources suggérées dans la section "Ajuster les demandes et les limites de ressources".

Cloud Monitoring

Pour afficher les demandes de ressources suggérées dans Cloud Monitoring, vous devez déployer une charge de travail existante.

Accédez à la page Explorateur de métriques dans la console Google Cloud .

Accéder à l'explorateur de métriques
Cliquez sur Configuration
Développez le menu Sélectionner une métrique.
Dans le menu Ressource, sélectionnez Scaling Kubernetes.
Dans le menu Catégorie de métrique, sélectionnez Autoscaler.
Dans le menu Métrique, sélectionnez Recommandée par octets de requête d'instance répliquée et Recommandé par cœur de requête d'instance répliquée.
Cliquez sur Appliquer.

CLI gcloud

Pour afficher les demandes de ressources suggérées, vous devez créer un objet VerticalPodAutoscaler et un Déploiement.

Pour les clusters standards, activez l'autoscaling de pods vertical de votre cluster. Sur les clusters Autopilot, l'autoscaling de pods vertical est activé par défaut.
```
gcloud container clusters update CLUSTER_NAME --enable-vertical-pod-autoscaling
```
Remplacez CLUSTER_NAME par le nom de votre cluster.

Enregistrez le manifeste suivant sous le nom my-rec-deployment.yaml :

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-rec-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-rec-deployment
  template:
    metadata:
      labels:
        app: my-rec-deployment
    spec:
      containers:
      - name: my-rec-container
        image: nginx

Ce fichier manifeste décrit un Deployment qui ne dispose pas de demandes de ressources de mémoire ou de processeur. La valeur containers.name de my-rec-deployment indique que tous les pods du déploiement appartiennent à VerticalPodAutoscaler.

Appliquez le fichier manifeste au cluster :

kubectl create -f my-rec-deployment.yaml

Enregistrez le manifeste suivant sous le nom my-rec-vpa.yaml :
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-rec-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-rec-deployment
  updatePolicy:
    updateMode: "Off"
```
Ce fichier manifeste décrit un VerticalPodAutoscaler. La valeur updateMode de Off signifie que lors de la création des pods, le contrôleur de l'autoscaler de pods vertical analyse les besoins en ressources de mémoire et de processeur, puis enregistre ces recommandations dans le champ status de la ressource. Le contrôleur de l'autoscaler de pods vertical ne met pas automatiquement à jour les demandes de ressources pour les conteneurs en cours d'exécution.
Appliquez le fichier manifeste au cluster :
```
kubectl create -f my-rec-vpa.yaml
```

Attendez un certain temps, puis affichez VerticalPodAutoscaler :

kubectl get vpa my-rec-vpa --output yaml

Le résultat ressemble à ce qui suit :

...
  recommendation:
    containerRecommendations:
    - containerName: my-rec-container
      lowerBound:
        cpu: 25m
        memory: 262144k
      target:
        cpu: 25m
        memory: 262144k
      upperBound:
        cpu: 7931m
        memory: 8291500k
...

Cette sortie affiche des recommandations pour les demandes de ressources de mémoire et de processeur.

Définir manuellement les demandes de ressources des pods

Vous pouvez définir manuellement des demandes de ressources de pod à l'aide de la console Google Cloud ou de kubectl. Suivez les bonnes pratiques suivantes pour définir les demandes et les limites de ressources de vos conteneurs :

Mémoire : définissez la même quantité de mémoire pour la demande et la limite.
Processeur : pour la requête, spécifiez le processeur minimal nécessaire pour assurer un fonctionnement correct, selon vos propres SLO. Définissez une limite de processeur illimitée.

Console

Accédez à la page Charges de travail dans la console Google Cloud .

Accéder à la page Charges de travail
Dans la liste des charges de travail, cliquez sur le nom de la charge de travail que vous souhaitez faire évoluer.
Cliquez sur Actions > Effectuer le scaling > Modifier les demandes de ressources.
1. La section Ajuster les demandes et les limites de ressources indique les demandes actuelles de ressources mémoire et de processeur pour chaque conteneur, ainsi que les demandes de ressources mémoire et de processeur suggérées.
Cliquez sur Appliquer les dernières suggestions pour afficher les requêtes suggérées pour chaque conteneur.
Cliquez sur Enregistrer les modifications.
Cliquez sur Confirmer.

kubectl

Faites évoluer votre charge de travail verticalement avec un minimum d'interruptions

À partir de la version 1.33 de Kubernetes, vous pouvez utiliser la commande kubectl patch pour mettre à l'échelle verticalement votre charge de travail en mettant à jour les ressources attribuées à un conteneur, sans recréer le pod. Pour en savoir plus, y compris sur les limites, consultez la documentation Kubernetes sur le redimensionnement des ressources de processeur et de mémoire.

Pour utiliser la commande kubectl patch, spécifiez la demande de ressource mise à jour sous l'indicateur --patch. Par exemple, pour mettre à l'échelle my-app à 800 mCPUs, exécutez la commande suivante :

kubectl patch pod my-app --subresource resize --patch \
  '{"spec":{"containers":[{"name":"pause", "resources":{"requests":{"cpu":"800m"}, "limits":{"cpu":"800m"}}}]}}'

Faire évoluer votre charge de travail verticalement

Pour définir les demandes de ressources pour un pod, définissez les valeurs "requests.cpu" et "memory.cpu" dans votre fichier manifeste du Déploiement. Dans cet exemple, vous modifiez manuellement le Déploiement créé dans Analyser les demandes de ressources avec des demandes de ressources suggérées.

Enregistrez l'exemple de fichier manifeste suivant sous le nom my-adjusted-deployment.yaml :

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-rec-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-rec-deployment
  template:
    metadata:
      labels:
        app: my-rec-deployment
    spec:
      containers:
      - name: my-rec-container
        image: nginx
        resources:
          requests:
            cpu: 25m
            memory: 256Mi

Ce fichier manifeste décrit un Déploiement comportant deux pods. Chaque pod contient un conteneur qui demande 25 milliprocesseurs et 256 Mio de mémoire.

Appliquez le fichier manifeste au cluster :

kubectl apply -f my-adjusted-deployment.yaml

Définir automatiquement les demandes de ressources des pods

L'autoscaling de pods vertical utilise l'objet VerticalPodAutoscaler pour définir automatiquement les demandes de ressources sur les pods lorsque updateMode est défini sur Auto. Vous pouvez configurer un VerticalPodAutoscaler à l'aide de gcloud CLI ou de la consoleGoogle Cloud .

Console

Pour définir automatiquement les demandes de ressources, vous devez disposer d'un cluster sur lequel la fonctionnalité d'autoscaling vertical des pods est activée. La fonctionnalité d'autoscaling vertical des pods est activée par défaut sur les clusters Autopilot.

Activer l'autoscaling vertical des pods

Accédez à la page Google Kubernetes Engine dans la console Google Cloud .

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez modifier.
Dans la section Automatisation, cliquez sur Modifier pour l'option Autoscaling des pods vertical.
Cochez la case Activer l'autoscaling de pods verticaux.
Cliquez sur Enregistrer les modifications.

Configurer l'autoscaling de pods vertical

Accédez à la page Charges de travail dans la console Google Cloud .

Accéder à la page Charges de travail
Dans la liste des charges de travail, cliquez sur le nom du déploiement pour lequel vous souhaitez configurer l'autoscaling vertical des pods.
Cliquez sur Actions > Autoscaling > Autoscaling de pods vertical.
Choisissez un mode d'autoscaling :
- Mode automatique : l'autoscaling vertical des pods met à jour les demandes de ressources mémoire et processeur pendant toute la durée de vie d'un pod.
- Mode initial : l'autoscaling vertical des pods n'attribue des demandes de ressources que lors de la création du pod et ne les modifie jamais ultérieurement.
(Facultatif) Définissez des stratégies sur les conteneurs. Cette option vous permet de vous assurer que la recommandation n'est jamais définie au-dessus ou en dessous d'une demande de ressources spécifique.
1. Cliquez sur Ajouter une stratégie.
2. Dans le champ Modifier le mode de conteneur, sélectionnez Auto.
3. Dans Ressources contrôlées, sélectionnez les ressources sur lesquelles vous souhaitez autoscaler le conteneur.
4. Cliquez sur Ajouter une stratégie pour définir une ou plusieurs plages minimales ou maximales pour les demandes de ressources du conteneur :
  - Mémoire min. allouée : quantité minimale de mémoire dont le conteneur doit toujours disposer, en Mio.
  - CPU min. alloué : quantité minimale de CPU dont le conteneur doit toujours disposer, en mCPU.
  - Mémoire max. allouée : quantité maximale de mémoire dont le conteneur doit toujours disposer, en Mio.
  - CPU max. alloué : quantité maximale de processeurs dont le conteneur doit toujours disposer, en mCPU.
Cliquez sur OK.
Cliquez sur Enregistrer.

gcloud

Pour définir automatiquement les demandes de ressources, vous devez disposer d'un cluster sur lequel la fonctionnalité d'autoscaling vertical des pods est activée. Cette fonctionnalité est activée par défaut sur les clusters Autopilot.

Pour les clusters standards, activez l'autoscaling vertical des pods de votre cluster :
```
gcloud container clusters update CLUSTER_NAME --enable-vertical-pod-autoscaling
```
Remplacez CLUSTER_NAME par le nom de votre cluster.

Enregistrez le manifeste suivant sous le nom my-auto-deployment.yaml :

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-auto-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-auto-deployment
  template:
    metadata:
      labels:
        app: my-auto-deployment
    spec:
      containers:
      - name: my-container
        image: registry.k8s.io/ubuntu-slim:0.14
        resources:
          requests:
            cpu: 100m
            memory: 50Mi
        command: ["/bin/sh"]
        args: ["-c", "while true; do timeout 0.5s yes >/dev/null; sleep 0.5s; done"]

Ce fichier manifeste décrit un Déploiement comportant deux pods. Chaque pod contient un conteneur qui demande 100 milliprocesseurs et 50 Mio de mémoire.

Appliquez le fichier manifeste au cluster :

kubectl create -f my-auto-deployment.yaml

Établissez la liste des pods en cours d'exécution :

kubectl get pods

Le résultat affiche le nom des pods dans my-deployment :

NAME                            READY     STATUS             RESTARTS   AGE
my-auto-deployment-cbcdd49fb-d6bf9   1/1       Running            0          8s
my-auto-deployment-cbcdd49fb-th288   1/1       Running            0          8s

Enregistrez le manifeste suivant sous le nom my-vpa.yaml :
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-auto-deployment
  updatePolicy:
    updateMode: "Recreate"
```
Ce fichier manifeste décrit un objet VerticalPodAutoscaler avec les propriétés suivantes :
- targetRef.name : indique que tout pod contrôlé par un déploiement nommé my-deployment appartient à cet objet VerticalPodAutoscaler.
- updateMode: "Recreate" : indique que le contrôleur de l'autoscaler vertical de pods peut supprimer un pod, ajuster les demandes de ressources mémoire et de processeur, puis démarrer un nouveau pod. Il s'agit du comportement par défaut si aucun mode n'est spécifié (également appelé mode Auto). Vous pouvez également définir le mode de mise à jour sur l'une des valeurs suivantes :
  - updateMode: "Initial" : l'autoscaling vertical des pods n'attribue des demandes de ressources qu'au moment de la création du pod.
  - updateMode: "InPlaceOrRecreate" (Aperçu) : l'autoscaling vertical des pods tente de mettre à jour les ressources sans recréer le pod, et revient à la recréation si nécessaire.
Appliquez le fichier manifeste au cluster :
```
kubectl create -f my-vpa.yaml
```
Attendez quelques minutes et affichez à nouveau les pods en cours d'exécution :
```
kubectl get pods
```
Le résultat indique que les noms des pods ont changé :
```
NAME                                 READY     STATUS             RESTARTS   AGE
my-auto-deployment-89dc45f48-5bzqp   1/1       Running            0          8s
my-auto-deployment-89dc45f48-scm66   1/1       Running            0          8s
```
Si les noms des pods n'ont pas changé, attendez un peu plus longtemps, puis affichez à nouveau les pods en cours d'exécution.

Afficher les informations sur un autoscaling vertical des pods

Pour afficher les informations détaillées sur un autoscaling vertical des pods, procédez comme suit :

Pour obtenir des informations détaillées sur l'un de vos pods en cours d'exécution, saisissez :
```
kubectl get pod POD_NAME --output yaml
```
Remplacez POD_NAME par le nom de l'un de vos pods que vous avez récupéré à l'étape précédente.

Le résultat ressemble à ce qui suit :
```
apiVersion: v1
kind: Pod
metadata:
  annotations:
    vpaUpdates: 'Pod resources updated by my-vpa: container 0: cpu capped to node capacity, memory capped to node capacity, cpu request, memory request'
...
spec:
  containers:
  ...
    resources:
      requests:
        cpu: 510m
        memory: 262144k
    ...
```
Ce résultat montre que le contrôleur de l'autoscaling vertical des pods demande 262 144 Ko de mémoire et 510 milliCPU de processeur.
Obtenez des informations détaillées sur VerticalPodAutoscaler :
```
kubectl get vpa my-vpa --output yaml
```
Le résultat ressemble à ce qui suit :
```
...
  recommendation:
    containerRecommendations:
    - containerName: my-container
      lowerBound:
        cpu: 536m
        memory: 262144k
      target:
        cpu: 587m
        memory: 262144k
      upperBound:
        cpu: 27854m
        memory: "545693548"
```
Cette sortie affiche des recommandations pour les demandes de ressources de mémoire et de CPU et inclut les propriétés suivantes :
- target : indique que le conteneur doit fonctionner de manière optimale avec 587 milliCPU et 262 144 Ko de mémoire.
- lowerBound et upperBound : l'autoscaling vertical des pods utilise ces propriétés pour décider de supprimer un pod et de le remplacer par un nouveau. Si les demandes d'un pod sont en dessous de la limite inférieure ou au-dessus de la limite supérieure, l'autoscaler vertical des pods le supprime et le remplace par un pod ayant l'attribut cible.

Désactiver des conteneurs spécifiques

Vous pouvez désactiver des conteneurs spécifiques de l'autoscaling vertical des pods à l'aide de gcloud CLI ou de la console Google Cloud .

Console

Pour désactiver des conteneurs spécifiques de l'autoscaling vertical des pods, vous devez disposer d'un cluster sur lequel la fonctionnalité d'autoscaling vertical de pods est activée. La fonctionnalité d'autoscaling vertical des pods est activée par défaut sur les clusters Autopilot.

Activer l'autoscaling vertical des pods

Accédez à la page Google Kubernetes Engine dans la console Google Cloud .

Accéder à Google Kubernetes Engine
Dans la liste des clusters, cliquez sur le nom du cluster que vous souhaitez modifier.
Dans la section Automatisation, cliquez sur Modifier pour l'option Autoscaling des pods vertical.
Cochez la case Activer l'autoscaling de pods verticaux.
Cliquez sur Enregistrer les modifications.

Configurer l'autoscaling de pods vertical

Accédez à la page Charges de travail dans la console Google Cloud .

Accéder à la page Charges de travail
Dans la liste des charges de travail, cliquez sur le nom du déploiement pour lequel vous souhaitez configurer l'autoscaling vertical des pods.
Cliquez sur Actions > Autoscaling > Autoscaling de pods vertical.
Choisissez un mode d'autoscaling :
- Mode automatique : l'autoscaling vertical des pods met à jour les demandes de ressources mémoire et processeur pendant toute la durée de vie d'un pod.
- Mode initial : l'autoscaling vertical des pods n'attribue des demandes de ressources que lors de la création du pod et ne les modifie jamais ultérieurement.
Cliquez sur Ajouter une stratégie.
Sélectionnez le conteneur que vous souhaitez désactiver.
Dans le champ Modifier le mode de conteneur, sélectionnez Désactiver.
Cliquez sur OK.
Cliquez sur Enregistrer.

gcloud

Pour désactiver des conteneurs spécifiques de l'autoscaling vertical des pods, procédez comme suit :

Enregistrez le manifeste suivant sous le nom my-opt-vpa.yaml :

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-opt-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-opt-deployment
  updatePolicy:
    updateMode: "Recreate"
  resourcePolicy:
    containerPolicies:
    - containerName: my-opt-sidecar
      mode: "Off"

Ce fichier manifeste décrit un VerticalPodAutoscaler. La valeur mode: "Off" désactive les recommandations pour le conteneur my-opt-sidecar.

Appliquez le fichier manifeste au cluster :
```
kubectl apply -f my-opt-vpa.yaml
```

Enregistrez le manifeste suivant sous le nom my-opt-deployment.yaml :

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-opt-deployment
spec:
  replicas: 1
  selector:
    matchLabels:
      app: my-opt-deployment
  template:
    metadata:
      labels:
        app: my-opt-deployment
    spec:
      containers:
      - name: my-opt-container
        image: nginx
      - name: my-opt-sidecar
        image: busybox
        command: ["sh","-c","while true; do echo Doing sidecar stuff!; sleep 60; done"]

Appliquez le fichier manifeste au cluster :

kubectl apply -f my-opt-deployment.yaml

Après quelque temps, affichez l'autoscaler vertical des pods :
```
kubectl get vpa my-opt-vpa --output yaml
```
La sortie affiche des recommandations pour les demandes de ressources mémoire et de processeur :
```
...
  recommendation:
    containerRecommendations:
    - containerName: my-opt-container
...
```
Sur cette sortie, il n'existe de recommandations que pour un seul conteneur. Il n'existe aucune recommandation pour my-opt-sidecar.

L'autoscaler de pods verticaux ne met jamais à jour les ressources sur les conteneurs désactivés. Si vous attendez quelques minutes, le pod se recrée, mais les demandes de ressources n'ont été mises à jour que sur un seul conteneur.

Identifier les charges de travail sans demandes ni limites de ressources

Vous pouvez identifier les charges de travail sans demandes ni limites de ressources configurées, car GKE recommande de définir des demandes et des limites de ressources pour toutes les charges de travail. Il s'agit d'une bonne pratique qui permet d'éviter l'arrêt brutal des pods en cas de pression sur les ressources des nœuds et d'améliorer la précision de la répartition des coûts. Définir des pods BestEffort ou des pods avec une mémoire Burstable peut entraîner des problèmes de fiabilité lorsqu'un nœud fait face à une saturation de la mémoire. Suivez les bonnes pratiques suivantes pour définir les demandes et les limites de ressources de vos conteneurs :

Mémoire : définissez la même quantité de mémoire pour la demande et la limite.
Processeur : pour la requête, spécifiez le processeur minimal nécessaire pour assurer un fonctionnement correct, selon vos propres SLO. Définissez une limite de processeur illimitée.

GKE génère des insights et des recommandations pour les charges de travail qui s'exécutent sans demandes ni limites de ressources.

Le tableau suivant décrit les scénarios de configuration des ressources détectés par GKE et les critères de chaque scénario.

Sous-type d'insight	Scénario de paramètres manquants	Détails
`REQUEST_OR_LIMIT_NOT_SET`	Aucune limite ni demande de mémoire n'est configurée. (`MEMORY_REQUEST_AND_LIMIT_NOT_SET`)	Les pods s'exécutent sans qu'aucune demande ni limite de mémoire n'ait été définie pour leurs conteneurs. GKE ne peut pas limiter l'utilisation de la mémoire et peut arrêter brusquement ces pods si un nœud fait face à une saturation de la mémoire, ce qui peut entraîner des problèmes de fiabilité.
`REQUEST_OR_LIMIT_NOT_SET`	Aucune limite de mémoire configurée. (`MEMORY_LIMIT_NOT_SET`)	Les pods s'exécutent sans qu'aucune limite de mémoire n'ait été définie pour leurs conteneurs. GKE ne peut pas limiter l'utilisation de la mémoire et peut arrêter brutalement ces pods si un nœud fait face à une saturation de la mémoire et que l'utilisation de la mémoire des pods dépasse les demandes, ce qui peut entraîner des problèmes de fiabilité. Vous devez définir la même quantité de mémoire pour les demandes et les limites afin d'éviter que les pods n'utilisent plus de mémoire que demandé.
`REQUEST_OR_LIMIT_NOT_SET`	Aucune limite ni demande de processeur n'est configurée. (`CPU_REQUEST_AND_LIMIT_NOT_SET`)	Les pods s'exécutent sans qu'aucune demande ni limite de processeur n'ait été définie pour les conteneurs. Cela augmente le risque d'épuisement des ressources de nœuds, expose les pods au risque de limitation lorsque l'utilisation du processeur de nœuds est proche de sa limite et peut entraîner des problèmes de performances.

Pour en savoir plus sur ces insights, suivez les instructions pour afficher les insights et les recommandations.

Vérifier manuellement les demandes et les limites de ressources

Vous pouvez examiner manuellement les demandes et limites de ressources manquantes qui doivent être spécifiées pour une charge de travail donnée. Vous pourrez ainsi mettre à jour la configuration comme recommandé.

Pour examiner ou mettre à jour la configuration des limites et des demandes de ressources pour une charge de travail spécifique, procédez comme suit :

Accédez à la page Charges de travail dans la console Google Cloud .

Accéder à la page Charges de travail
Dans la liste des charges de travail, cliquez sur le nom de la charge de travail que vous souhaitez inspecter.
Cliquez sur Actions > Effectuer le scaling > Modifier les demandes de ressources.
1. La section Ajuster les demandes et les limites de ressources indique les demandes actuelles de ressources mémoire et de processeur pour chaque conteneur.

Étapes suivantes

En savoir plus sur l'autoscaling de pods vertical
Apprenez les bonnes pratiques pour l'exécution d'applications Kubernetes à coût maîtrisé sur GKE.
Découvrez comment optimiser votre utilisation de GKE avec des insights et des recommandations.