Cette page a été traduite par l'API Cloud Translation.

Demandes de ressources dans Autopilot

Autopilot

Pour améliorer la stabilité des charges de travail, le mode Autopilot de Google Kubernetes Engine (GKE) gère les valeurs des demandes de ressources de pod, telles que le processeur, la mémoire ou le stockage éphémère. Cette page contient les informations suivantes, que vous pouvez utiliser pour planifier des charges de travail efficaces, stables et économiques :

Valeurs par défaut qu'Autopilot applique aux pods qui ne spécifient pas de valeurs.
Valeurs minimales et maximales qu'Autopilot applique aux demandes de ressources.
Comment les valeurs par défaut, minimales et maximales varient en fonction du matériel demandé par vos pods.

Cette page est destinée aux opérateurs et aux développeurs qui provisionnent et configurent des ressources cloud, et déploient des charges de travail. Pour en savoir plus sur les rôles courants et les exemples de tâches que nous citons dans le contenu Google Cloud, consultez Rôles utilisateur et tâches courantes de GKE.

Vous devez déjà connaître la gestion des ressources Kubernetes.

Présentation des demandes de ressources dans Autopilot

Autopilot utilise les requêtes de ressources que vous spécifiez dans la configuration de votre charge de travail pour configurer les nœuds qui les exécutent. Autopilot applique des requêtes de ressources minimales et maximales en fonction de la classe de calcul ou de la configuration matérielle utilisée par vos charges de travail. Si vous ne spécifiez pas de requêtes pour certains conteneurs, Autopilot attribue des valeurs par défaut pour permettre à ces conteneurs de s'exécuter correctement.

Lorsque vous déployez une charge de travail dans un cluster Autopilot, GKE valide la configuration de la charge de travail par rapport aux valeurs minimales et maximales autorisées pour la classe de calcul sélectionnée ou la configuration matérielle (tels que les GPU). Si les requêtes sont inférieures au minimum, Autopilot modifie automatiquement la configuration de votre charge de travail pour que les requêtes soient comprises dans la plage autorisée. Si les requêtes sont supérieures au maximum, Autopilot rejette votre charge de travail et affiche un message d'erreur.

La liste suivante récapitule les catégories de demandes de ressources :

Requêtes de ressources par défaut : Autopilot les ajoute si vous ne spécifiez pas vos propres requêtes pour les charges de travail.
Nombre minimal et maximal de demandes de ressources : Autopilot valide les requêtes spécifiées pour s'assurer qu'elles sont dans les limites. Si vos requêtes dépassent les limites, Autopilot modifie vos requêtes de charge de travail.
Séparation des charges de travail et requêtes de durée étendue : Autopilot possède différentes valeurs par défaut et différentes valeurs minimales pour les charges de travail que vous divisez ou pour les pods qui bénéficient d'une protection étendue avec l'éviction lancée par GKE.
Demandes de ressources pour les objets DaemonSet : Autopilot possède des valeurs par défaut, minimales et maximales différentes pour les conteneurs des objets DaemonSet.

Comment demander des ressources

Dans Autopilot, vous demandez des ressources dans la spécification de votre pod. Les ressources minimales et maximales acceptées que vous pouvez demander varient en fonction de la configuration matérielle du nœud sur lequel les pods sont exécutés. Pour savoir comment demander des configurations matérielles spécifiques, reportez-vous aux pages suivantes :

Demandes de ressources par défaut

Si vous ne spécifiez pas de demandes de ressources pour certains conteneurs d'un pod, Autopilot applique les valeurs par défaut. Ces valeurs par défaut sont adaptées à de nombreuses charges de travail de faible volume.

De plus, Autopilot applique les demandes de ressources par défaut suivantes, quelle que soit la classe de calcul sélectionnée ou la configuration matérielle :

Conteneurs dans DaemonSets
- Processeur : 50 mCPU
- Mémoire : 100 Mio
- Stockage éphémère : 100 Mio
Tous les autres conteneurs
- Stockage éphémère : 1 Gio

Pour en savoir plus sur les limites des clusters Autopilot, consultez la section Quotas et limites.

Requêtes par défaut pour les classes de calcul

Autopilot applique les valeurs par défaut suivantes aux ressources qui ne sont pas définies dans la spécification du pod pour les pods exécutés sur des classes de calcul. Si vous ne définissez qu'une seule des requêtes et laissez l'autre vide, GKE utilise le ratio processeur/mémoire défini dans la section Nombre minimal et maximal de requêtes pour définir la requête manquante sur une valeur conforme au ratio.

Classe de calcul	Ressource	Requête par défaut
Usage général (par défaut)	Processeur	0,5 vCPU
Usage général (par défaut)	Mémoire	2 Gio
Accélérateur	Aucune requête par défaut n'est appliquée.
Équilibré	Processeur	0,5 vCPU
Équilibré	Mémoire	2 Gio
Performances	Aucune requête par défaut n'est appliquée.
Scaling horizontal	Processeur	0,5 vCPU
Scaling horizontal	Mémoire	2 Gio

Demandes de ressources minimum et maximum

Le nombre total des ressources demandées par votre configuration de déploiement doit être inférieur aux valeurs minimales et maximales autorisées par Autopilot. Les conditions suivantes s'appliquent :

Requêtes de stockage éphémère :
- Le stockage éphémère utilise le disque de démarrage de la VM, sauf si vos nœuds sont associés à des disques SSD locaux.
  
  Le matériel de calcul comprenant des disques SSD locaux comme des GPU A100 (80 Go), des GPU H100 (80 Go) ou des séries de machines Z3 acceptent une requête maximale égale à la taille du disque SSD local moins les frais système. Pour en savoir plus sur cette surcharge système, consultez Stockage éphémère sauvegardé par les disques SSD locaux.
- Dans GKE version 1.29.3-gke.1038000 et ultérieures, les pods de classe Performance et les pods d'accélérateur matériel acceptent une demande de stockage éphémère maximale de 56 Tio, sauf si le matériel inclut des disques SSD locaux.
  
  Dans tous les autres pods Autopilot, quelle que soit la version de GKE, la demande totale de stockage éphémère pour tous les conteneurs du pod doit être comprise entre 10 Mio et 10 Gio, sauf indication contraire.
- Pour les volumes plus importants, utilisez des volumes éphémères génériques, qui offrent des fonctionnalités et des performances équivalentes au stockage éphémère, mais avec une flexibilité bien plus importante car ils peuvent s'utiliser avec n'importe quelle option de stockage GKE. Par exemple, la taille maximale d'un volume éphémère générique utilisant pd-balanced est de 64 Tio.
Pour les pods DaemonSet, les demandes de ressources minimales sont les suivantes :
- Clusters compatibles avec l'utilisation intensive : 1 mCPU par pod, 2 Mio de mémoire par pod et 10 Mio de stockage éphémère par conteneur dans le pod.
- Clusters non compatibles avec l'utilisation intensive : 10 mCPU par pod, 10 Mio de mémoire par pod et 10 Mio de stockage éphémère par conteneur dans le pod.
Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.
Si votre cluster est compatible avec l'utilisation intensive, Autopilot n'applique pas d'incréments de 0,25 vCPU pour les requêtes de processeurs de votre pod. Si votre cluster n'est pas compatible avec l'utilisation intensive, Autopilot arrondit vos requêtes de processeur au 0,25 vCPU le plus proche. Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.
Le ratio processeur/mémoire doit être compris dans la plage autorisée pour la classe de calcul sélectionnée ou la configuration matérielle. Si le ratio processeur/mémoire se situe en dehors de la plage autorisée, Autopilot augmente automatiquement la ressource la plus petite. Par exemple, si vous demandez 1 vCPU et 16 Gio de mémoire (ratio 1:16) pour les pods exécutés sur la classe Scale-Out, Autopilot augmente la demande de processeur à 4 vCPU, ce qui passe le ratio à 1:4.

Valeurs minimales et maximales pour les classes de calcul

Le tableau suivant décrit le ratio processeur/mémoire minimal, maximal et autorisé pour chaque classe de calcul compatible avec Autopilot :

Classe de calcul	Ratio processeur:mémoire (processeur virtuel:Gio)	Ressource	Minimum	Maximum
Usage général (par défaut)	Entre 1:1 et 1:6.5	Processeur	La valeur varie selon que votre cluster est compatible avec l'utilisation intensive, comme suit : Clusters compatibles avec l'utilisation intensive : 50 mCPU Clusters non compatibles avec l'utilisation intensive : 250 mCPU Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.	30 vCPU
Usage général (par défaut)	Entre 1:1 et 1:6.5	Mémoire	La valeur varie selon que votre cluster est compatible avec l'utilisation intensive, comme suit : Clusters compatibles avec l'utilisation intensive : 52 Mio Clusters non compatibles avec l'utilisation intensive : 512 Mio Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.	110 Gio
Accélérateur	Consultez Valeurs minimales et maximales pour les accélérateurs.
Équilibré	Entre 1:1 et 1:8	Processeur	0,25 vCPU	222 vCPU Si vous avez sélectionné la plate-forme de processeur minimale : Plates-formes Intel : 126 vCPU Plates-formes AMD : 222 vCPU
Équilibré	Entre 1:1 et 1:8	Mémoire	0,5 Gio	851 Gio Si vous avez sélectionné la plate-forme de processeur minimale : Plates-formes Intel : 823 Gio Plates-formes AMD : 851 Gio
Performances	N/A	Processeur	Aucun nombre minimal de demandes n'est appliqué	Série de machines C2 : 58 processeurs virtuels Série de machines C2D : 110 processeurs virtuels Série de machines C3 : 174 processeurs virtuels Série de machines C3 avec SSD local : 174 processeurs virtuels Série de machines C3D : 358 processeurs virtuels Série de machines C3D avec SSD local : 358 processeurs virtuels Série de machines C4D (1.33.0-gke.1439000 ou version ultérieure) : 382 vCPU Série de machines C4D avec SSD local (1.33.1-gke.1171000 ou version ultérieure) : 382 processeurs virtuels Série de machines H3 : 86 processeurs virtuels Série de machines H4D (1.33.2-gke.4731000 ou version ultérieure) : 192 processeurs virtuels Série de machines T2A : 46 processeurs virtuels Série de machines T2D : 58 processeurs virtuels Série de machines C4 : 286 processeurs virtuels Série de machines M4 (1.33.4-gke.1013000 ou version ultérieure) : 224 processeurs virtuels Série de machines N4 : 78 processeurs virtuels Série de machines Z3 : 174 processeurs virtuels
		Mémoire	Aucun nombre minimal de demandes n'est appliqué	Série de machines C2 : 218 Gio Série de machines C2D : 835 Gio Série de machines C3 : 1345 Gio Série de machines C3 avec disque SSD local : 670 Gio Série de machines C3D : 2750 Gio Série de machines C3D avec SSD local : 1375 Gio Série de machines C4D (1.33.0-gke.1439000 ou version ultérieure) : 2 905 Gio Série de machines C4D avec SSD local (1.33.1-gke.1171000 ou version ultérieure) : 2 905 Gio Série de machines H3 : 330 Gio Série de machines H4D (1.33.2-gke.4731000 ou version ultérieure) : 1 400 Gio Série de machines T2A : 172 Gio Série de machines T2D : 218 Gio Série de machines C4 : 2 140 Gio Série de machines M4 (1.33.4-gke.1013000 ou version ultérieure) : 5952 Gio Série de machines N4 : 600 Gio Série de machines Z3 : 34 000 Gio
		Espace de stockage éphémère	Aucun nombre minimal de demandes n'est appliqué	Série de machines C2 : 56 Tio Série de machines C2D : 56 Tio Série de machines C3 : 56 Tio Série de machines C3 avec SSD local : 10 000 Gio Série de machines C3D : 56 Tio Série de machines C3D avec SSD local : 10 000 Gio Série de machines C4D (1.33.0-gke.1439000 ou version ultérieure) : 56 Tio Série de machines C4D avec SSD local (1.33.1-gke.1171000 ou version ultérieure) : 10 000 Gio Série de machines H3 : 56 Tio Série de machines H4D (1.33.2-gke.4731000 ou version ultérieure) : 56 Tio Série de machines T2A : 56 Tio Série de machines T2D : 56 Tio Série de machines C4 : 56 Tio Série de machines M4 (1.33.4-gke.1013000 ou version ultérieure) : 56 Tio Série de machines N4 : 56 Tio Série de machines Z3 : 34 000 Gio
Scaling horizontal	Exactement 1:4	Processeur	0,25 vCPU	`arm64` : 43 vCPU `amd64` : 54 vCPU
Scaling horizontal	Exactement 1:4	Mémoire	1 Gio	`arm64` : 172 Gio `amd64` : 216 Gio

Pour savoir comment demander des classes de calcul dans vos pods Autopilot, consultez la section Choisir les classes de calcul pour les pods Autopilot.

Valeurs minimales et maximales pour les accélérateurs

GKE n'applique pas de demandes minimales de processeur, de mémoire ou de stockage éphémère pour les pods qui utilisent des accélérateurs. Le tableau suivant décrit le nombre maximal de requêtes pour chacune de ces ressources en fonction du nombre et du type d'accélérateur que vous utilisez.

Sauf indication contraire, la capacité de stockage éphémère maximale est de 56 Tio.

Type d'accélérateur	Ressource	Maximum
NVIDIA B200 `nvidia-B200`	Processeur	8 GPU : 224 processeurs virtuels
	Mémoire	8 GPU : 3 968 Gio
	Espace de stockage éphémère	8 GPU : 10 Tio
NVIDIA H200 (141 Go) `nvidia-h200-141gb`	Processeur	8 GPU : 224 processeurs virtuels
	Mémoire	8 GPU : 2 952 Gio
	Espace de stockage éphémère	8 GPU : 10 Tio (1.32.2-gke.1182000 ou version ultérieure) 8 GPU : 2 540 Gio (version antérieure à 1.32.2-gke.1182000)
NVIDIA H100 Mega (80 Go) `nvidia-h100-mega-80gb`	Processeur	8 GPU : 206 processeurs virtuels
	Mémoire	8 GPU : 1 795 Gio
	Espace de stockage éphémère	8 GPU : 5 250 Gio
NVIDIA H100 80 Go `nvidia-h100-80gb`	Processeur	8 GPU : 206 processeurs virtuels
	Mémoire	8 GPU : 1 795 Gio
	Espace de stockage éphémère	8 GPU : 5 250 Gio
NVIDIA A100 40 Go `nvidia-tesla-a100`	Processeur	1 GPU : 11 processeurs virtuels 2 GPU : 22 processeurs virtuels 4 GPU : 46 processeurs virtuels 8 GPU : 94 processeurs virtuels 16 GPU : 94 processeurs virtuels La somme des requêtes de processeurs de tous les objets DaemonSet exécutés sur un nœud GPU A100 ne doit pas dépasser 2 processeurs virtuels.
NVIDIA A100 40 Go `nvidia-tesla-a100`	Mémoire	1 GPU : 74 Gio 2 GPU : 148 Gio 4 GPU : 310 Gio 8 GPU : 632 Gio 16 GPU : 1 264 Gio La somme des requêtes de mémoire de tous les objets DaemonSet exécutés sur un nœud GPU A100 ne doit pas dépasser 14 Gio.
NVIDIA A100 80 Go `nvidia-a100-80gb`	Processeur	1 GPU : 11 processeurs virtuels 2 GPU : 22 processeurs virtuels 4 GPU : 46 processeurs virtuels 8 GPU : 94 processeurs virtuels La somme des requêtes de processeurs de tous les objets DaemonSet exécutés sur un nœud GPU A100 (80 Go) ne doit pas dépasser 2 processeurs virtuels.
	Mémoire	1 GPU : 148 Gio 2 GPU : 310 Gio 4 GPU : 632 Gio 8 GPU : 1 264 Gio La somme des requêtes de mémoire de tous les objets DaemonSet exécutés sur un nœud GPU A100 (80 Go) ne doit pas dépasser 14 Gio.
	Espace de stockage éphémère	1 GPU : 280 Gio 2 GPU : 585 Gio 4 GPU : 1 220 Gio 8 GPU : 2 540 Gio
NVIDIA L4 `nvidia-l4`	Processeur	1 GPU : 31 processeurs virtuels 2 GPU : 23 processeurs virtuels 4 GPU : 47 processeurs virtuels 8 GPU : 95 processeurs virtuels La somme des requêtes de processeurs de tous les objets DaemonSet exécutés sur un nœud GPU L4 ne doit pas dépasser 2 processeurs virtuels.
NVIDIA L4 `nvidia-l4`	Mémoire	1 GPU : 115 Gio 2 GPU : 83 Gio 4 GPU : 177 Gio 8 GPU : 363 Gio La somme des requêtes de mémoire de tous les objets DaemonSet exécutés sur un nœud GPU L4 ne doit pas dépasser 14 Gio.
NVIDIA Tesla T4 `nvidia-tesla-t4`	Processeur	1 GPU : 46 processeurs virtuels 2 GPU : 46 processeurs virtuels 4 GPU : 94 processeurs virtuels
NVIDIA Tesla T4 `nvidia-tesla-t4`	Mémoire	1 GPU : 287,5 Gio 2 GPU : 287,5 Gio 4 GPU : 587,5 Gio
TPU v5e `tpu-v5-lite-podslice`	Processeur	Topologie 1x1 : 24 processeurs virtuels Topologie 2x2 : 112 processeurs virtuels Topologie 2x4 (requête à quatre puces) : 112 processeurs virtuels Topologie 2x4 (requête à 8 puces) : 224 processeurs virtuels Topologie 4x4 : 112 processeurs virtuels Topologie 4x8 : 112 processeurs virtuels Topologie 8x8 : 112 processeurs virtuels Topologie 8x16 : 112 processeurs virtuels Topologie 16x16 : 112 processeurs virtuels
	Mémoire	Topologie 1x1 : 48 Gio Topologie 2x2 : 192 Gio Topologie 2x4 (requête à quatre puces) : 192 Gio Topologie 2x4 (requête à 8 puces) : 384 Gio Topologie 4x4 : 192 Gio Topologie 4x8 : 192 Gio Topologie 8x8 : 192 Gio Topologie 8x16 : 192 Gio Topologie 16x16 : 192 Gio
	Espace de stockage éphémère	56 Tio
TPU v5p `tpu-v5p-slice`	Processeur	280 vCPU
	Mémoire	448 Gio
	Espace de stockage éphémère	56 Tio
TPU v4 `tpu-v4-podslice`	Processeur	240 vCPU
	Mémoire	407 Gio
	Espace de stockage éphémère	56 Tio

Pour savoir comment demander des GPU dans vos pods Autopilot, consultez la section Déployer des charges de travail GPU dans Autopilot.

Demandes de ressources pour la séparation des charges de travail et la durée étendue

Autopilot vous permet de manipuler le comportement de planification et d'éviction de Kubernetes à l'aide des méthodes suivantes :

Utilisez des rejets et tolérances et des sélecteurs de nœuds pour vous assurer que certains pods ne sont placés que sur des nœuds spécifiques. Pour en savoir plus, consultez la page Configurer la séparation des charges de travail dans GKE.
Utilisez l'anti-affinité de pod pour empêcher les pods de coexister sur le même nœud. Les requêtes de ressources par défaut et minimales pour les charges de travail qui utilisent ces méthodes afin de contrôler le comportement de la planification sont plus élevées que pour les charges de travail qui ne les utilisent pas.
Utilisez une annotation pour protéger les pods contre l'éviction provoquée par des mises à niveau automatiques des nœuds et des événements de réduction de capacité pendant sept jours maximum. Pour en savoir plus, consultez la section Prolonger la durée d'exécution des pods Autopilot.

Si les requêtes spécifiées sont inférieures aux minimums, le comportement d'Autopilot change en fonction de la méthode utilisée, comme suit :

Rejets, tolérances, sélecteurs et pods de durée prolongée : Autopilot modifie vos pods pour augmenter les requêtes lors de la planification des pods.
Anti-affinité de pod : Autopilot rejette le pod et affiche un message d'erreur.

Le tableau suivant décrit les requêtes par défaut et les requêtes de ressources minimales que vous pouvez spécifier. Si une classe de configuration ou de calcul ne figure pas dans ce tableau, Autopilot n'applique pas de valeurs minimales ou par défaut spéciales.

Classe de calcul	Ressource	Par défaut	Minimum
Usage général	Processeur	0,5 vCPU	0,5 vCPU
Usage général	Mémoire	2 Gio	0,5 Gio
Équilibré	Processeur	2 vCPU	1 vCPU
Équilibré	Mémoire	8 Gio	4 Gio
Scaling horizontal	Processeur	0,5 vCPU	0,5 vCPU
Scaling horizontal	Mémoire	2 Gio	2 Gio

Conteneurs d'initialisation

Les conteneurs d'initialisation s'exécutent de manière séquentielle. Tous les conteneurs d'initialisation doivent avoir terminé leur exécution avant que les conteneurs d'application puissent démarrer. Dans les clusters Autopilot, si vous ne spécifiez pas de demandes de processeur ou de mémoire pour les conteneurs d'initialisation, ou si vous définissez explicitement les demandes sur 0, Autopilot modifie vos pods lors de la création pour ajouter des demandes de ressources à chaque conteneur d'initialisation. Les demandes attribuées à chaque conteneur d'initialisation sont égales à la somme des demandes de tous les conteneurs d'application du pod. Il s'agit du comportement par défaut.

Ce comportement diffère de celui des clusters Standard, où les conteneurs d'initialisation utilisent toutes les ressources non allouées disponibles sur le nœud sur lequel le pod est planifié.

Allocation automatique des ressources pour les conteneurs init

L'allocation automatique des ressources pour les conteneurs init a lieu lors de la création du pod. Nous vous suggérons de ne pas spécifier manuellement de demandes de ressources pour les conteneurs d'initialisation dans les clusters Autopilot, afin que chaque conteneur obtienne par défaut toutes les ressources disponibles pour le pod.

Si vous modifiez les demandes de ressources des conteneurs non initiaux du pod après sa création, Autopilot n'ajuste pas automatiquement les demandes de ressources des conteneurs initiaux. Par conséquent, vous pouvez constater des frais qui ne correspondent pas à l'utilisation réelle des ressources du pod. Votre facture est basée sur la demande de ressources effective du pod, qui correspond à la plus grande des valeurs suivantes :

Demande de ressources la plus importante de tous les conteneurs d'initialisation du pod.
Somme des demandes pour tous les conteneurs d'application du pod.

Pour en savoir plus, consultez Gestion automatique des ressources dans Autopilot.

Allocation manuelle de ressources pour les conteneurs init

Si vous devez modifier les demandes de ressources existantes pour les conteneurs de votre application afin de gérer les coûts et les ressources, nous vous recommandons de procéder de l'une des manières suivantes pour ajuster les demandes de votre conteneur d'initialisation :

Mettez à jour manuellement les demandes de ressources pour le conteneur d'initialisation afin qu'elles correspondent aux nouvelles demandes totales du pod. Tenez compte des points suivants lorsque vous spécifiez manuellement les demandes de ressources :
- Les demandes inférieures aux ressources totales du pod peuvent limiter le conteneur d'initialisation.
- Les demandes supérieures aux ressources totales du pod peuvent augmenter les coûts.
Supprimez les demandes de ressources pour permettre à Autopilot de les recalculer. Par défaut, Autopilot réalloue les ressources à chaque conteneur d'initialisation en fonction du total des ressources actuellement demandées par tous les conteneurs d'application du pod.

Définir des limites de ressources dans Autopilot

Kubernetes vous permet de définir requests et limits pour les ressources de votre spécification de pod. Le comportement de vos pods varie selon que votre limits est différent de votre requests, comme décrit dans le tableau suivant :

Valeurs définies	Comportement d'Autopilot
`requests` égal à `limits`	Les pods utilisent la classe QoS `Guaranteed`. Remarque : Les limites de stockage éphémère doivent toujours être définies explicitement sur des valeurs égales aux demandes. GKE modifie vos pods pour appliquer cette règle.
`requests` défini, `limits` non défini	Le comportement varie selon que votre cluster est compatible avec l'utilisation intensive, comme suit : Clusters compatibles avec l'utilisation intensive : les pods peuvent passer en capacité intensive disponible. Clusters non compatibles avec l'utilisation intensive : GKE définit les `limits` pour être égales aux `requests`. Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.
`requests` non défini, `limits` défini.	Autopilot définit `requests` sur la valeur de `limits`, qui est le comportement de Kubernetes par défaut. Avant : resources: limits: cpu: "400m" Après : resources: requests: cpu: "400m" limits: cpu: "400m"
`requests` de moins que `limits`	Le comportement varie selon que votre cluster est compatible avec l'utilisation intensive, comme suit : Clusters compatibles avec l'utilisation intensive : les pods peuvent passer en utilisation intensive jusqu'à la valeur spécifiée dans `limits`. Clusters non compatibles avec l'utilisation intensive : GKE définit les `limits` pour être égales aux `requests`. Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.
`requests` supérieur à `limits`	Autopilot définit `requests` sur la valeur de `limits`. Avant : resources: requests: cpu: "450m" limits: cpu: "400m" Après : resources: requests: cpu: "400m" limits: cpu: "400m"
`requests` non défini, `limits` non défini.	Autopilot définit les valeurs par défaut de `requests` pour la classe de calcul ou la configuration matérielle. Le comportement de `limits` varie selon que votre cluster est compatible avec l'utilisation intensive, comme suit : Clusters compatibles avec l'utilisation intensive : Autopilot ne définit pas `limits`. Clusters non compatibles avec l'utilisation intensive : GKE définit les `limits` pour être égales aux `requests`. Pour vérifier si votre cluster est compatible avec l'utilisation intensive, consultez la page Utilisation intensive de la disponibilité dans GKE.

Dans la plupart des cas, définissez des demandes de ressources adéquates et des limites égales pour vos charges de travail.

Pour les charges de travail nécessitant temporairement plus de ressources que leur état stable, par exemple au démarrage ou pendant les périodes de trafic plus élevées, définissez des limites supérieures à vos requêtes pour permettre aux pods de passer en utilisation intensive. Pour en savoir plus, consultez la page Configurer l'utilisation intensive des pods dans GKE.

Gestion automatique des ressources dans Autopilot

Si les demandes de ressources spécifiées pour vos charges de travail se situent en dehors des plages autorisées, ou si vous ne demandez pas de ressources pour certains conteneurs, Autopilot modifie la configuration de votre charge de travail pour respecter les limites autorisées. Autopilot calcule les ratios de ressources et les exigences de scaling des ressources après avoir appliqué les valeurs par défaut aux conteneurs sans spécifier de requête.

Requêtes manquantes : si vous ne demandez pas de ressources dans certains conteneurs, Autopilot applique les requêtes par défaut pour la classe de calcul ou la configuration matérielle.
Ratio processeur/mémoire : Autopilot augmente la taille de la ressource la plus petite afin d'atteindre le ratio dans la plage autorisée.
Stockage éphémère : Autopilot modifie vos requêtes de stockage éphémère afin d'atteindre la quantité minimale requise par chaque conteneur. La valeur cumulative des requêtes de stockage pour tous les conteneurs ne peut pas être supérieure à la valeur maximale autorisée. Avant la version 1.28.6-gke.1317000, Autopilot réduisait le stockage éphémère demandé si la valeur dépassait la valeur maximale. Dans la version 1.28.6-gke.1317000 et les versions ultérieures, Autopilot rejette votre charge de travail.
Requêtes inférieures aux valeurs minimales : si vous demandez moins de ressources que le minimum autorisé pour la configuration matérielle sélectionnée, Autopilot modifie automatiquement le pod pour demander au moins la valeur minimale de ressources.

Par défaut, lorsque Autopilot augmente automatiquement la taille d'une ressource pour atteindre une valeur de ressource minimale ou par défaut, GKE alloue la capacité supplémentaire au premier conteneur du fichier manifeste du pod. Dans GKE 1.27.2-gke.2200 et versions ultérieures, vous pouvez indiquer à GKE d'allouer les ressources supplémentaires à un conteneur spécifique en ajoutant ce qui suit au champ annotations de votre fichier manifeste de pod :

autopilot.gke.io/primary-container: "CONTAINER_NAME"

Remplacez CONTAINER_NAME par le nom du conteneur.

Exemples de modification de ressources

L'exemple de scénario suivant montre comment Autopilot modifie la configuration de votre charge de travail pour répondre aux exigences de vos pods et conteneurs en cours d'exécution.

Conteneur unique avec un processeur inférieur à 0,05 vCPU

Nombre de conteneurs	Demande initiale	Demande modifiée
1	Processeur : 30 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio	Processeur : 50 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio

Plusieurs conteneurs avec un processeur total inférieur à 0,05 vCPU

Nombre de conteneurs	Demandes d'origine	Demandes modifiées
1	Processeur : 10 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio	Processeur : 30 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio
2	Processeur : 10 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio	Processeur : 10 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio
3	Processeur : 10 mvCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio	Processeur : 10 mCPU Mémoire : 0,5 Gio Stockage éphémère : 10 Mio
Total des ressources du pod		Processeur : 50 mCPU Mémoire : 1,5 Gio Stockage éphémère : 30 Mio

Conteneur unique avec une mémoire trop faible pour le processeur demandé

Dans cet exemple, la mémoire est trop faible pour la quantité de processeurs (1 vCPU pour 1 Gio minimum). Le ratio minimal processeur/mémoire autorisé est de 1:1. Si le ratio est inférieur à cette valeur, la demande de mémoire est augmentée.

Nombre de conteneurs	Demande initiale	Demande modifiée
1	Processeur : 4 processeurs virtuels Mémoire : 1 Gio Stockage éphémère : 10 Mio	Processeur : 4 processeurs virtuels Mémoire : 4 Gio Stockage éphémère : 10 Mio
Total des ressources du pod		Processeur : 4 processeurs virtuels Mémoire : 4 Gio Stockage éphémère : 10 Mio