할당량 및 한도


이 문서에서는 Google Kubernetes Engine에 적용되는 할당량한도를 설명합니다. 할당량에 대한 자세한 내용은 가상 프라이빗 클라우드(VPC) 할당량을 참조하세요.

할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 Google Cloud 프로젝트에서 사용할 수 있는 공유 Google Cloud 리소스의 양을 제한합니다. 따라서 할당량은 다음을 수행하는 시스템에 속합니다.

  • Google Cloud 제품 및 서비스 사용 또는 소비를 모니터링합니다.
  • 공정성 보장 및 사용량 급증 방지 등의 이유로 리소스 소비를 제한합니다.
  • 사전 정의된 제한사항을 자동으로 적용하는 구성을 유지합니다.
  • 할당량을 요청하거나 변경할 수 있는 수단을 제공합니다.

대부분의 경우 할당량이 초과되면 시스템에서 관련 Google 리소스에 대한 액세스를 즉시 차단하고 수행하려는 작업이 실패합니다. 대부분의 경우 할당량은 각 Google Cloud 프로젝트에 적용되며 해당 Google Cloud 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.

대부분의 할당량은 Google Cloud 콘솔을 사용해 늘리거나 줄입니다. 자세한 내용은 할당량 상향 요청을 참조하세요.

GKE 리소스에도 한도가 있습니다. 이 한도는 할당량 시스템과 관련이 없습니다. 별도로 명시되지 않는 한 한도를 변경할 수 없습니다.

프로젝트당 한도

단일 프로젝트에서 영역당 최대 100개의 영역 클러스터와 리전당 100개의 리전 클러스터를 만들 수 있습니다.

참고: Autopilot 모드에서 생성된 클러스터는 리전 클러스터로 사전에 구성되어 있습니다.

클러스터당 한도

다음 표에서는 GKE 클러스터당 한도에 대해 설명합니다.

다음 표에 지정된 모든 GKE 버전이 클러스터 노드 및 제어 영역에 모두 적용됩니다.

한도 GKE Standard 클러스터 GKE Autopilot 클러스터
클러스터당 노드 노드 15,000개

참고: 노드를 2,000개 넘게 실행하려면 리전 클러스터를 사용합니다.

참고: 5,000개를 초과하는 노드를 실행하는 것은 비공개 또는 Private Service Connect를 사용하는 리전 클러스터와 GKE Dataplane V2가 사용 중지된 리전 클러스터에서만 가능합니다. 이 할당량 한도를 늘리려면 지원팀에 문의하세요.

노드 5,000개

참고: 노드를 1,000개 넘게 실행하려면 GKE Autopilot 버전 1.23 이상을 사용합니다.

참고: 노드를 400개 넘게 실행하려면 이전 버전에서 생성된 클러스터에 대해 클러스터 크기 할당량을 늘려야 합니다. 도움이 필요한 경우 지원팀에 문의하세요.

노드 풀당 노드 영역당 노드 1,000개 해당 없음
영역의 노드
  • NEG 기반 인그레스를 통해 컨테이너 기반 부하 분산을 사용하는 경우에는 노드 제한사항이 없으므로 가능하면 사용하는 것이 좋습니다. GKE 버전 1.17 이상에서는 NEG 기반 인그레스가 기본 모드입니다.
  • 인스턴스 그룹 기반 인그레스를 사용하는 경우 노드 1,000개
해당 없음
노드당 포드1 포드 256개

참고: 1.23.5-gke.1300 이전의 GKE 버전에서는 포드 110개로 제한됩니다.

8~256 사이의 값을 동적으로 설정합니다. GKE는 클러스터 크기와 워크로드 수를 고려하여 노드당 최대 포드 수를 프로비저닝합니다.

  • 1.28 이전의 GKE 버전에서는 포드 32개로 제한됩니다.
  • 가속기 클래스 포드 및 성능 클래스 포드의 경우 노드당 포드 1개로 제한됩니다.
클러스터당 포드2 포드 200,000개1 포드 200,000개
클러스터당 컨테이너 컨테이너 400,000개 컨테이너 400,000개
Etcd 데이터베이스 크기 6GB 6GB

플랫폼 관리자로서 GKE에서 실행되는 대규모 워크로드에 할당량이 미치는 영향을 파악하는 것이 좋습니다. 대규모 워크로드의 추가 권장사항, 한도 및 할당량은 확장 가능한 클러스터 만들기 가이드라인을 참조하세요.

API 요청 한도

Kubernetes Engine API의 기본 비율 제한은 분당 요청 3,000회이며 100초 간격으로 적용됩니다.

리소스 할당량

노드가 100개 미만인 클러스터의 경우 GKE는 Kubernetes 리소스 할당량을 모든 네임스페이스에 적용합니다. 이러한 할당량은 클러스터에 배포된 애플리케이션의 잠재적인 버그로 인해 클러스터의 제어 영역이 불안정해지는 일이 없도록 보호합니다. 이러한 할당량은 GKE에서 적용되므로 삭제할 수 없습니다.

GKE는 노드 수에 비례하여 리소스 할당량 값을 자동으로 업데이트합니다. 노드가 100개를 초과하는 클러스터의 경우 GKE가 리소스 할당량을 삭제합니다.

리소스 할당량을 살펴보려면 다음 명령어를 사용합니다.

kubectl get resourcequota gke-resource-quotas -o yaml

특정 네임스페이스의 값을 보려면 --namespace 옵션을 추가하여 네임스페이스를 지정하세요.

할당량 확인

콘솔

  1. Google Cloud 콘솔에서 할당량 페이지로 이동합니다.

    할당량으로 이동

  2. 할당량 페이지에는 GKE 할당량으로 사전 필터링된 할당량 목록이 표시됩니다.
  3. 정확한 할당량을 검색하려면 필터 테이블을 사용합니다. 할당량 이름을 모르면 할당량 페이지의 링크를 사용할 수 있습니다.

gcloud

  1. 할당량을 확인하려면 다음 명령어를 실행합니다.
    gcloud compute project-info describe --project PROJECT_ID

    여기서 PROJECT_ID는 프로젝트 ID로 바꿉니다.

  2. 리전에서 사용한 할당량을 확인하려면 다음 명령어를 실행합니다.
    gcloud compute regions describe example-region

참고

  1. GKE Standard 클러스터당 최대 포드 수에는 시스템 포드가 포함됩니다. 시스템 포드 수는 클러스터 구성 및 사용 설정된 기능에 따라 달라집니다.

  2. 노드에 들어갈 수 있는 최대 포드 수는 포드 리소스 요청의 크기 및 노드 용량에 따라 달라집니다. 동시에 모든 한도에 도달하지 못할 수도 있습니다. 권장사항에 따라 테스트 대규모 배포를 로드하는 것이 좋습니다.