Cette page fournit un ensemble de recommandations pour la planification, la définition de l'architecture, le déploiement, le scaling et l'exploitation de charges de travail volumineuses sur des clusters Google Kubernetes Engine (GKE). Nous vous recommandons de suivre ces recommandations pour que vos charges de travail soumises au scaling respectent les objectifs de niveau de service (SLO).
Recommandations disponibles pour l'évolutivité
Avant de planifier et de concevoir une architecture GKE, mappez les paramètres spécifiques à votre charge de travail (par exemple, le nombre d'utilisateurs actifs, le temps de réponse attendu, les ressources de calcul requises) avec les ressources utilisées par Kubernetes (par exemple les pods, les services et les "CustomResourceDefinition"). Une fois ces informations mappées, consultez les recommandations de GKE pour l'évolutivité.
Les recommandations pour l'évolutivité sont divisées selon les domaines de planification suivants :
Planifier pour l'évolutivité : découvrez les bonnes pratiques générales de conception de vos charges de travail et clusters pour des performances fiables lors de l'exécution sur des clusters de petite et de grande taille. Ces recommandations sont utiles pour les architectes, les administrateurs de plate-forme et les développeurs Kubernetes. Pour en savoir plus, consultez la section Planifier pour l'évolutivité.
Planifier les clusters GKE de grande taille : apprenez à planifier l'exécution de clusters GKE de très grande taille. Découvrez les limites connues de Kubernetes et de GKE, et les moyens d'éviter de les atteindre. Ces recommandations sont utiles pour les architectes et les administrateurs de plate-forme. Pour en savoir plus, consultez la section Planifier des clusters GKE volumineux.
Planifier les charges de travail volumineuses : apprenez à planifier des architectures exécutant des charges de travail Kubernetes volumineuses sur GKE. Cette section couvre les recommandations pour la répartition de la charge de travail entre les projets et les clusters, et l'ajustement des quotas requis par cette charge de travail. Ces recommandations sont utiles pour les architectes et les administrateurs de plate-forme.
Pour en savoir plus, consultez la page Planifier des charges de travail volumineuses.
Ces recommandations d'évolutivité sont générales à GKE et sont applicables aux modes GKE Standard et GKE Autopilot. GKE Autopilot provisionne et gère pour vous l'infrastructure sous-jacente du cluster. Par conséquent, certaines recommandations ne sont pas applicables.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/08/04 (UTC)."],[],[],null,["# About GKE Scalability\n\n[Autopilot](/kubernetes-engine/docs/concepts/autopilot-overview) [Standard](/kubernetes-engine/docs/concepts/choose-cluster-mode)\n\n*** ** * ** ***\n\nThis page provides a set of recommendations for planning, architecting, deploying, scaling, and operating large workloads on Google Kubernetes Engine (GKE) clusters. We recommend you follow these recommendations to keep your scaling workloads within [service-level objectives (SLOs)](https://landing.google.com/sre/sre-book/chapters/service-level-objectives).\n\n\u003cbr /\u003e\n\nAvailable recommendations for scalability\n-----------------------------------------\n\nBefore planning and designing a GKE architecture, map parameters specific to your\nworkload (for example the number of active users, expected response time,\nrequired compute resources) with the resources used by Kubernetes (such as Pods,\nServices, and 'CustomResourceDefinition'). With this information mapped, review\nthe GKE scalability recommendations.\n\nThe scalability recommendations are divided based in the following planning scopes:\n\n- **Plan for scalability** : To learn about the general best practices for designing your workloads and clusters for reliable performance when running on both small and large clusters. These recommendations are useful for architects, platform administrators, and Kubernetes developers. To learn more, see [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- **Plan for large-size GKE clusters** : To learn how to plan to run very big-size GKE clusters. Learn about known limits of Kubernetes and GKE and ways to avoid reaching them. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters).\n- **Plan for large workloads** : To learn how to plan architectures that run large Kubernetes workloads on GKE. It covers recommendations for distributing the workload among projects and clusters, and adjusting these workload required quotas. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads).\n\nThese scalability recommendations are general to GKE and are applicable to both\nGKE Standard and GKE Autopilot modes. GKE Autopilot provisions and manages\nthe cluster's underlying infrastructure for you, therefore some recommendations\nare not applicable.\n| **Caution:** Test your planned cluster configuration before its implementation. Some design decisions might include fixed parameters, for example, CIDRs definition. Changing these parameters on existing clusters is not available and it requires cluster recreation.\n\nWhat's next?\n------------\n\n- [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters)\n- [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads)\n- See our episodes about [building large GKE clusters](https://www.youtube.com/watch?v=542XwAPKh4g)."]]