이 페이지에서는 Google Kubernetes Engine(GKE) 클러스터에서 대규모 워크로드를 계획, 설계, 배포, 확장, 운영하기 위한 일련의 권장사항을 제공합니다. 서비스 수준 목표(SLO) 내에서 확장 워크로드를 유지하려면 다음 권장사항을 따르는 것이 좋습니다.
확장성과 관련해 사용 가능한 권장사항
GKE 아키텍처를 계획하고 설계하기 전에 워크로드별 매개변수(예: 활성 사용자 수, 예상 응답 시간, 필수 컴퓨팅 리소스)를 Kubernetes에서 사용하는 리소스 (예: 포드, 서비스, 'CustomResourceDefinition')에 매핑합니다. 이 정보가 매핑되면 GKE 확장성 권장사항을 검토합니다.
확장성 권장사항은 다음 계획 범위를 기준으로 구분됩니다.
확장성 계획: 소규모 클러스터와 대규모 클러스터 모두에서 실행할 때 안정적인 성능을 위해 워크로드와 클러스터를 설계하는 일반적인 권장사항을 알아봅니다. 이러한 권장사항은 설계자, 플랫폼 관리자, Kubernetes 개발자에게 유용합니다. 자세한 내용은 확장성 계획을 참조하세요.
대규모 GKE 클러스터 계획: 대규모 GKE 클러스터 실행을 계획하는 방법을 알아봅니다. Kubernetes 및 GKE의 알려진 한도와 이러한 한도를 초과하지 않는 방법을 알아봅니다. 이러한 권장사항은 설계자와 플랫폼 관리자에게 유용합니다. 자세한 내용은 대규모 GKE 클러스터 계획을 참조하세요.
대규모 워크로드 계획: GKE에서 대규모 Kubernetes 워크로드를 실행하는 아키텍처를 계획하는 방법을 알아봅니다. 프로젝트 및 클러스터에 워크로드를 분산하고 이러한 워크로드에 필요한 할당량을 조정하는 방법에 대한 권장사항을 다룹니다. 이러한 권장사항은 설계자와 플랫폼 관리자에게 유용합니다.
자세한 내용은 대규모 워크로드 계획을 참조하세요.
이러한 확장성 권장사항은 GKE에 일반적으로 적용되며 GKE Standard 및 GKE Autopilot 모드 모두에 적용됩니다. GKE Autopilot은 클러스터의 기본 인프라를 자동으로 프로비저닝하고 관리하므로 일부 권장사항은 적용되지 않습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-08-08(UTC)"],[],[],null,["# About GKE Scalability\n\n[Autopilot](/kubernetes-engine/docs/concepts/autopilot-overview) [Standard](/kubernetes-engine/docs/concepts/choose-cluster-mode)\n\n*** ** * ** ***\n\nThis page provides a set of recommendations for planning, architecting, deploying, scaling, and operating large workloads on Google Kubernetes Engine (GKE) clusters. We recommend you follow these recommendations to keep your scaling workloads within [service-level objectives (SLOs)](https://landing.google.com/sre/sre-book/chapters/service-level-objectives).\n\n\u003cbr /\u003e\n\nAvailable recommendations for scalability\n-----------------------------------------\n\nBefore planning and designing a GKE architecture, map parameters specific to your\nworkload (for example the number of active users, expected response time,\nrequired compute resources) with the resources used by Kubernetes (such as Pods,\nServices, and 'CustomResourceDefinition'). With this information mapped, review\nthe GKE scalability recommendations.\n\nThe scalability recommendations are divided based in the following planning scopes:\n\n- **Plan for scalability** : To learn about the general best practices for designing your workloads and clusters for reliable performance when running on both small and large clusters. These recommendations are useful for architects, platform administrators, and Kubernetes developers. To learn more, see [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- **Plan for large-size GKE clusters** : To learn how to plan to run very big-size GKE clusters. Learn about known limits of Kubernetes and GKE and ways to avoid reaching them. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters).\n- **Plan for large workloads** : To learn how to plan architectures that run large Kubernetes workloads on GKE. It covers recommendations for distributing the workload among projects and clusters, and adjusting these workload required quotas. These recommendations are useful for architects and platform administrators. To learn more, see [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads).\n\nThese scalability recommendations are general to GKE and are applicable to both\nGKE Standard and GKE Autopilot modes. GKE Autopilot provisions and manages\nthe cluster's underlying infrastructure for you, therefore some recommendations\nare not applicable.\n| **Caution:** Test your planned cluster configuration before its implementation. Some design decisions might include fixed parameters, for example, CIDRs definition. Changing these parameters on existing clusters is not available and it requires cluster recreation.\n\nWhat's next?\n------------\n\n- [Plan for scalability](/kubernetes-engine/docs/concepts/planning-scalability).\n- [Plan for large GKE clusters](/kubernetes-engine/docs/concepts/planning-large-clusters)\n- [Plan for large workloads](/kubernetes-engine/docs/concepts/planning-large-workloads)\n- See our episodes about [building large GKE clusters](https://www.youtube.com/watch?v=542XwAPKh4g)."]]