Nesta página, você encontra um conjunto de recomendações para planejar, arquitetar, implantar, escalonar e operar cargas de trabalho grandes em clusters do Google Kubernetes Engine (GKE). Recomendamos seguir
essas recomendações para manter as cargas de trabalho de escalonamento dentro dos
objetivos de nível de serviço (SLOs).
Recomendações disponíveis para escalonabilidade
Antes de planejar e projetar uma arquitetura do GKE, mapeie os parâmetros específicos da sua
carga de trabalho (por exemplo, o número de usuários ativos, o tempo de resposta esperado,
os recursos de computação necessários) e os recursos usados pelo Kubernetes (como pods, Serviços e "CustomResourceDefinition"). Com essas informações mapeadas, analise
as recomendações de escalonabilidade do GKE.
As recomendações de escalonabilidade são divididas com base nos seguintes escopos de planejamento:
Planejar a escalonabilidade: para saber mais sobre as práticas recomendadas gerais para
projetar suas cargas de trabalho e clusters para um desempenho confiável ao executar
em clusters pequenos e grandes. Essas recomendações são úteis para arquitetos,
administradores de plataformas e desenvolvedores do Kubernetes. Para saber mais, consulte
Planejar a escalonabilidade.
Planejar clusters do GKE de grande porte: para saber como planejar a execução de clusters do GKE de grande porte. Saiba mais sobre os limites conhecidos do Kubernetes e do GKE e as maneiras
de evitar alcançá-los. Essas recomendações são úteis para arquitetos
e administradores da plataforma. Para saber mais, consulte
Planejar para grandes clusters do GKE.
Planejar para grandes cargas de trabalho: para aprender a planejar arquiteturas que executam
grandes cargas de trabalho do Kubernetes no GKE. Ele abrange recomendações para distribuir
a carga de trabalho entre projetos e clusters e ajustar essas cotas
necessárias. Essas recomendações são úteis para arquitetos e administradores de plataformas.
Para saber mais, consulte
Planejar para grandes cargas de trabalho.
Essas recomendações de escalonabilidade são gerais para o GKE e são aplicáveis aos modos
GKE Standard e GKE Autopilot. O Autopilot do GKE provisiona e gerencia
a infraestrutura do cluster para você. Portanto, algumas recomendações
não são aplicáveis.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-04 UTC."],[],[],null,["# About GKE Scalability\n\n[Autopilot](/kubernetes-engine/docs/concepts/autopilot-overview) [Standard](/kubernetes-engine/docs/concepts/choose-cluster-mode)\n\n*** ** * ** ***\n\nThis page provides a set of recommendations for planning, architecting, deploying, scaling, and operating large workloads on Google Kubernetes Engine (GKE) clusters. We recommend you follow these recommendations to keep your scaling workloads within [service-level objectives (SLOs)](https://landing.google.com/sre/sre-book/chapters/service-level-objectives).\n\n\u003cbr /\u003e\n\nAvailable recommendations for scalability\n-----------------------------------------\n\nBefore planning and designing a GKE architecture, map parameters specific to your\nworkload (for example the number of active users, expected response time,\nrequired compute resources) with the resources used by Kubernetes (such as Pods,\nServices, and 'CustomResourceDefinition'). With this information mapped, review\nthe GKE scalability recommendations.\n\nThe scalability recommendations are divided based in the following planning scopes:\n\n- **Plan for scalability** : To learn about the general best practices for designing your workloads and clusters for reliable performance when running on both small and large clusters. These recommendations are useful for architects, platform administrators, and Kubernetes developers. To learn more, see [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- **Plan for large-size GKE clusters** : To learn how to plan to run very big-size GKE clusters. Learn about known limits of Kubernetes and GKE and ways to avoid reaching them. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters).\n- **Plan for large workloads** : To learn how to plan architectures that run large Kubernetes workloads on GKE. It covers recommendations for distributing the workload among projects and clusters, and adjusting these workload required quotas. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads).\n\nThese scalability recommendations are general to GKE and are applicable to both\nGKE Standard and GKE Autopilot modes. GKE Autopilot provisions and manages\nthe cluster's underlying infrastructure for you, therefore some recommendations\nare not applicable.\n| **Caution:** Test your planned cluster configuration before its implementation. Some design decisions might include fixed parameters, for example, CIDRs definition. Changing these parameters on existing clusters is not available and it requires cluster recreation.\n\nWhat's next?\n------------\n\n- [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters)\n- [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads)\n- See our episodes about [building large GKE clusters](https://www.youtube.com/watch?v=542XwAPKh4g)."]]