Cette page a été traduite par l'API Cloud Translation.

Quotas et limites

Ce document répertorie les quotas et limites du système qui s'appliquent à Google Kubernetes Engine.

Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Surveiller votre consommation de produits et services Google Cloud
Limiter votre consommation de ces ressources
Demander des modifications de la valeur du quota et automatiser les ajustements de quota

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation de Cloud Quotas.

Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.

Des limites système s'appliquent également aux ressources GKE. Elles ne peuvent pas être modifiées.

Quotas par projet

Les quotas suivants s'appliquent à GKE :

Clusters zonaux par zone
Clusters régionaux par région
Lectures d'API
Écritures d'API

Remarque : Les clusters créés en mode Autopilot sont préconfigurés en tant que clusters régionaux.

Vérifier le quota

Pour afficher les quotas, accédez à la page Quotas de la console Google Cloud .

Accéder à la section "Quotas"

Pour gérer les quotas et en demander d'autres, consultez Afficher et gérer les quotas.

Limites par cluster

Les tableaux suivants décrivent les limites par cluster GKE.

Toutes les versions de GKE spécifiées dans le tableau suivant s'appliquent aux nœuds et au plan de contrôle du cluster.

Limites	Cluster GKE standard	Cluster GKE Autopilot
Nœuds par cluster	65 000 nœuds Si vous prévoyez d'utiliser cette limite, tenez compte des recommandations suivantes lorsque vous concevez votre architecture GKE : Si vous prévoyez d'exécuter plus de 2 000 nœuds, utilisez un cluster régional. L'exécution de plus de 7 500 nœuds n'est disponible que pour les clusters régionaux avec Private Service Connect et avec GKE Dataplane V2 désactivé. Contactez l'assistance pour augmenter cette limite de quota.	5 000 nœuds Si vous prévoyez d'utiliser cette limite, tenez compte des recommandations suivantes lorsque vous concevez votre architecture GKE : Si vous prévoyez d'exécuter plus de 1 000 nœuds, utilisez GKE Autopilot version 1.23 ou ultérieure. L'exécution de plus de 400 nœuds peut nécessiter l'augmentation de la limite de quota des clusters créés avec des versions antérieures. Contactez l'assistance pour obtenir de l'aide.
Nœuds par pool de nœuds	1 000 nœuds par zone 2 000 nœuds TPU par zone : nécessite les versions suivantes ou ultérieures : 1.28.5-gke.135500, 1.29.1-gke.1206000, 1.30	Non applicable
Nombre de nœuds dans une zone	L'équilibrage de charge natif en conteneurs avec un objet Ingress basé sur un NEG n'est soumis à aucune limite de nœuds. Il est recommandé autant que possible. Les objets Ingress basés sur un NEG sont le mode par défaut pour les versions 1.17 et ultérieures de GKE. 1 000 nœuds si vous utilisez un objet Ingress basé sur un groupe d'instances.	Non applicable
Pods par nœud¹	256 pods Remarque : Pour les versions de GKE antérieures à 1.23.5-gke.1300, la limite est de 110 pods.	Défini de manière dynamique sur une valeur comprise entre 8 et 256. GKE prend en compte la taille du cluster et le nombre de charges de travail pour provisionner le nombre maximal de pods par nœud. Pour les versions de GKE antérieures à la version 1.28, la limite est de 32 pods. Pour les pods de classes Accelerator et Performance, la limite est fixée à un pod par nœud.
Pods par cluster²	200 000 pods¹	200 000 pods
Conteneurs par cluster	400 000 conteneurs	400 000 conteneurs
Taille de la base de données etcd	6 GB	6 GB

En tant qu'administrateur de plate-forme, nous vous recommandons de vous familiariser avec l'impact des quotas sur les charges de travail volumineuses exécutées sur GKE. Pour obtenir d'autres recommandations, bonnes pratiques, limites et quotas pour les charges de travail volumineuses, consultez la page Consignes relatives à la création de clusters évolutifs.

Quotas de ressources

Pour les clusters comportant moins de 100 nœuds, GKE applique un quota de ressources Kubernetes à chaque espace de noms. Ces quotas protègent le plan de contrôle du cluster contre toute instabilité provoquée par d'éventuels bugs au sein des applications déployées dans le cluster. Vous ne pouvez pas supprimer ces quotas, car ils sont appliqués par GKE.

GKE met automatiquement à jour les valeurs des quotas de ressources proportionnellement au nombre de nœuds. Pour les clusters comportant plus de 100 nœuds, GKE supprime le quota de ressources.

Pour examiner les quotas de ressources, exécutez la commande suivante :

kubectl get resourcequota gke-resource-quotas -o yaml

Pour afficher les valeurs correspondant à un espace de noms donné, spécifiez l'espace de noms en ajoutant l'option --namespace.

Remarques

Le nombre maximal de pods par cluster GKE Standard inclut les pods système. Le nombre de pods système varie en fonction de la configuration du cluster et des fonctionnalités activées. ↩
Le nombre maximal de pods pouvant tenir dans un nœud dépend de la taille de vos demandes de ressources de pods et de la capacité du nœud. Il est possible que vous n'atteigniez pas toutes les limites à la fois. Nous vous recommandons de tester la charge des déploiements volumineux. ↩