이 문서에서는 Google Kubernetes Engine에 적용되는 할당량과 시스템 한도를 설명합니다. 할당량은 사용할 수 있고 계수 가능한 공유 리소스의 양을 지정하며 Google Kubernetes Engine과 같은 Google Cloud 서비스에서 정의합니다. 시스템 한도는 변경할 수 없는 고정 값입니다.
Google Cloud는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는 Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여 Google Cloud 사용자 커뮤니티를 보호합니다. 할당량은 자체 Google Cloud 리소스를 관리하는 데도 도움이 됩니다.
Cloud Quotas 시스템은 다음을 수행합니다.
- Google Cloud 제품 및 서비스 소비량 모니터링
- 리소스 소비 제한
- 할당량 값 변경을 요청할 수 있는 수단 제공
대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.
할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.
대부분의 할당량을 조정하려면 Google Cloud 콘솔을 사용합니다. 자세한 내용은 할당량 상향 요청을 참조하세요.
GKE 리소스에도 한도가 있습니다. 이 시스템 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 시스템 한도를 변경할 수 없습니다.
프로젝트당 한도
단일 프로젝트에서 영역당 최대 100개의 영역 클러스터와 리전당 100개의 리전 클러스터를 만들 수 있습니다.
참고: Autopilot 모드에서 생성된 클러스터는 리전 클러스터로 사전에 구성되어 있습니다.
클러스터당 한도
다음 표에서는 GKE 클러스터당 한도에 대해 설명합니다.
다음 표에 지정된 모든 GKE 버전이 클러스터 노드 및 제어 영역에 모두 적용됩니다.
한도 | GKE Standard 클러스터 | GKE Autopilot 클러스터 |
---|---|---|
클러스터당 노드 |
노드 15,000개
참고: 노드를 2,000개 넘게 실행하려면 리전 클러스터를 사용합니다. 참고: 5,000개를 초과하는 노드를 실행하는 것은 비공개 또는 Private Service Connect를 사용하는 리전 클러스터와 GKE Dataplane V2가 사용 중지된 리전 클러스터에서만 가능합니다. 이 할당량 한도를 늘리려면 지원팀에 문의하세요. |
노드 5,000개
참고: 노드를 1,000개 넘게 실행하려면 GKE Autopilot 버전 1.23 이상을 사용합니다. 참고: 노드를 400개 넘게 실행하려면 이전 버전에서 생성된 클러스터에 대해 클러스터 크기 할당량을 늘려야 합니다. 도움이 필요한 경우 지원팀에 문의하세요. |
노드 풀당 노드 | 영역당 노드 1,000개 | 해당 사항 없음 |
영역의 노드 |
|
해당 사항 없음 |
노드당 포드1 |
포드 256개
참고: 1.23.5-gke.1300 이전의 GKE 버전에서는 포드 110개로 제한됩니다. |
8~256 사이의 값을 동적으로 설정합니다. GKE는 클러스터 크기와 워크로드 수를 고려하여 노드당 최대 포드 수를 프로비저닝합니다.
|
클러스터당 포드2 | 포드 200,000개1 | 포드 200,000개 |
클러스터당 컨테이너 | 컨테이너 400,000개 | 컨테이너 400,000개 |
Etcd 데이터베이스 크기 | 6GB | 6GB |
플랫폼 관리자로서 GKE에서 실행되는 대규모 워크로드에 할당량이 미치는 영향을 파악하는 것이 좋습니다. 대규모 워크로드의 추가 권장사항, 한도 및 할당량은 확장 가능한 클러스터 만들기 가이드라인을 참조하세요.
API 요청 한도
Kubernetes Engine API의 기본 비율 제한은 분당 요청 3,000회이며 100초 간격으로 적용됩니다.
리소스 할당량
노드가 100개 미만인 클러스터의 경우 GKE는 Kubernetes 리소스 할당량을 모든 네임스페이스에 적용합니다. 이러한 할당량은 클러스터에 배포된 애플리케이션의 잠재적인 버그로 인해 클러스터의 제어 영역이 불안정해지는 일이 없도록 보호합니다. 이러한 할당량은 GKE에서 적용되므로 삭제할 수 없습니다.
GKE는 노드 수에 비례하여 리소스 할당량 값을 자동으로 업데이트합니다. 노드가 100개를 초과하는 클러스터의 경우 GKE가 리소스 할당량을 삭제합니다.
리소스 할당량을 살펴보려면 다음 명령어를 사용합니다.
kubectl get resourcequota gke-resource-quotas -o yaml
특정 네임스페이스의 값을 보려면 --namespace
옵션을 추가하여 네임스페이스를 지정하세요.
할당량 확인
콘솔
- Google Cloud 콘솔에서 할당량 페이지로 이동합니다. 할당량 페이지에는 GKE 할당량으로 사전 필터링된 할당량 목록이 표시됩니다.
- 정확한 할당량을 검색하려면 필터 테이블을 사용합니다. 할당량 이름을 모르면 할당량 페이지의 링크를 사용할 수 있습니다.
gcloud
- 할당량을 확인하려면 다음 명령어를 실행합니다.
gcloud compute project-info describe --project PROJECT_ID
여기서
PROJECT_ID
는 프로젝트 ID로 바꿉니다. - 리전에서 사용한 할당량을 확인하려면 다음 명령어를 실행합니다.
gcloud compute regions describe example-region