배정 할당량

이 문서에서는 Compute Engine에 적용되는 배정 할당량을 다룹니다.

배정 할당량

할당 할당량(리소스 할당량이라고도 함)은 프로젝트가 액세스할 수 있는 리소스 수를 정의합니다. Compute Engine은 다양한 이유로 리소스 사용량에 배정 할당량을 적용합니다. 예를 들어 할당량은 사용량이 예기치 않게 급증하는 것을 방지하여 Google Cloud 사용자 커뮤니티를 보호하는 데 도움이 됩니다. Google Cloud에서는 프로젝트를 제한적으로 이용할 수 있는 무료 체험판 할당량도 제공하므로 무료로 Google Cloud를 살펴볼 수 있습니다.

모든 프로젝트의 할당량이 동일하지는 않습니다. Google Cloud가 점차 늘어나면 할당량도 이에 따라 늘릴 수 있습니다. 앞으로 사용량이 현저하게 늘어날 것으로 예상되는 경우 Google Cloud 콘솔의 할당량 페이지에서 사전에 할당량 조정을 요청할 수 있습니다.

Compute Engine API의 비율 제한 할당량에 대한 자세한 내용은 API 할당량을 참조하세요.

할당량 및 리소스 가용성

배정 할당량이란 사용 가능한 리소스가 있을 때 해당 리소스 유형에 대하여 만들 수 있는 최대 리소스 수입니다. 할당량에서는 리소스를 항상 사용할 수 있다고 보장하지 않습니다. 사용 가능한 리소스가 없거나 선택한 리전에 리소스가 없다면 리전이나 프로젝트에 할당량이 남아 있더라도 해당 유형의 리소스를 새로 만들 수 없습니다. 예를 들어 us-central1에 새 외부 IP 주소를 만들 수 있는 할당량이 아직 남아 있지만 해당 리전에 사용 가능한 IP 주소가 없을 수도 있습니다.

마찬가지로 리전별 할당량이 있더라도 특정 영역에서 리소스를 사용하지 못할 수도 있습니다. 예를 들어 us-central1 리전에 VM 인스턴스를 만들 수 있는 할당량이 남아 있어도 us-central1-a 영역이 고갈되었다면 이 영역에서는 VM 인스턴스를 만들 수 없습니다. 이러한 경우 us-central1-f와 같은 다른 영역에서 동일한 리소스를 만들어 보세요. 영역 리소스가 고갈된 경우의 옵션에 대해 자세히 알아보려면 리소스 가용성 문제 해결 문서를 참조하세요.

배정 할당량

VM 인스턴스 요구사항을 계획할 경우 만들 수 있는 VM 인스턴스 수에 영향을 미치는 여러 할당량을 고려해야 합니다.

리전 및 전역 할당량

VM 할당량은 리전 수준에서 관리됩니다. VM 인스턴스, 인스턴스 그룹, 디스크 할당량, CPU는 영역에 관계없이 리전의 모든 VM에서 사용될 수 있습니다. 예를 들어 CPU 할당량은 리전 할당량이므로 리전마다 한도와 사용량 집계가 다릅니다. us-central1 리전에 있는 영역에서 n2-standard-16 인스턴스를 실행하려면 us-central1에 CPU 16개 이상의 할당량이 필요합니다.

네트워킹과 부하 분산 할당량은 방화벽, 부하 분산기, 네트워크, VPN을 만드는 데 필요하며, 이러한 할당량은 리전에 따라 달라지지 않는 글로벌 할당량입니다. 모든 리전에서 글로벌 할당량을 사용할 수 있습니다. 예를 들어 부하 분산기와 HTTP 또는 HTTPS 프록시에 할당되어 사용 중인 고정 외부 IP 주소는 전역 할당량을 사용합니다.

VM 인스턴스

VM 인스턴스 할당량은 리전 할당량이며 VM 실행 여부와 관계없이 특정 리전에 존재할 수 있는 VM 인스턴스 수를 제한합니다. 이 할당량은 Google Cloud Console의 할당량 페이지에 표시됩니다. Compute Engine에서 이 할당량을 자동으로 일반 CPU 할당량의 10배로 설정합니다. 따라서 이 할당량을 요청할 필요가 없습니다. VM 인스턴스 할당량이 더 필요하면 CPU를 더 많이 요청해야 합니다. CPU가 늘어나야 VM 인스턴스 할당량도 늘어나기 때문입니다. 이 할당량은 VM(실행 여부 무관), 일반 인스턴스, 선점형 인스턴스에 적용됩니다.

Google Cloud Console에서 할당량 페이지로 이동합니다.

할당량으로 이동
테이블 필터링을 클릭하고 서비스를 선택합니다.
Compute Engine API를 선택합니다.
할당량: VM 인스턴스를 선택합니다.
리전별 VM 인스턴스 할당량 목록을 보려면 모든 할당량을 클릭합니다. 리전 할당량은 사용량이 높은 순으로 나열됩니다.
할당량을 변경하려는 리전의 체크박스를 클릭합니다.
할당량 수정을 클릭합니다.
양식을 작성합니다.
요청 제출을 클릭합니다.

인스턴스 그룹

인스턴스 그룹을 사용하려면 그룹에서 사용하는 모든 리소스에 사용 가능한 할당량(예: CPU 할당량)과 그룹 리소스 자체에 사용 가능한 할당량을 확보해야 합니다. 생성하는 그룹 유형에 따라 다음과 같은 그룹 리소스 사용 할당량이 적용됩니다.

서비스 유형	서비스 할당량
리전(멀티 영역) 관리형 인스턴스 그룹	`Regional instance group managers`
영역(단일 영역) 관리형 인스턴스 그룹	공통: `Instance group managers` `Instance groups`
비관리(단일 영역) 인스턴스 그룹	`Instance groups`
리전(멀티 영역) 자동 확장 처리	`Regional autoscalers`
영역(단일 영역) 자동 확장 처리	`Autoscalers`

디스크 할당량

다음 영구 디스크 및 로컬 SSD 할당량은 리전별로 적용됩니다.

Local SSD per machine family (GB). 이 할당량은 각 VM의 머신 유형을 기준으로 리전의 VM에 연결할 수 있는 로컬 SSD 디스크 파티션을 합친 총 크기입니다. 로컬 SSD는 VM 인스턴스 재부팅 시 디스크가 유지되지 않으므로 내결함성이 높은 스크래치, 로컬 캐시 또는 처리 작업에 사용해야 하는 빠른 이페머럴 디스크입니다. 로컬 SSD 파티션은 375GB 단위로 판매되며 VM 1개에 최대 24개의 로컬 SSD 파티션을 연결할 수 있습니다. gcloud CLI 및 API에서는 이 할당량을 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY라고 합니다.

참고: LOCAL_SSD_TOTAL_GB 할당량은 지원 중단되었습니다. 로컬 SSD 할당량 사용량 및 한도를 보려면 Cloud Monitoring 대시보드, 알림, 쿼리에서 할당량 측정항목 compute.googleapis.com/local_ssd_total_storage_per_vm_family^베타를 사용해야 합니다. 자세한 내용은 로컬 SSD 할당량 보기 및 관리를 참조하세요.
Persistent disk standard (GB). 이 할당량은 한 리전에서 만들 수 있는 표준 영구 디스크의 총 크기입니다. 영구 디스크 및 로컬 SSD 성능 최적화에서 설명한 대로, 표준 영구 디스크는 SSD 영구 디스크 또는 로컬 SSD보다 IOPS 및 처리량이 낮습니다. 이 디스크는 내구성 있는 대규모 저장 디스크로, 부팅 디스크로, 그리고 연속 쓰기 프로세스(예: 로그)에 사용되는 경우에 비용 효율적입니다. 표준 영구 디스크는 내구성이 있으며 동일한 영역 내에서 VM에 연결할 수 있도록 무기한 제공됩니다. gcloud CLI 및 API에서는 이 할당량을 DISKS_TOTAL_GB라고 합니다. 이 할당량은 리전 표준 영구 디스크에도 적용되며, 리전 디스크는 한 리전 내의 두 영역에서 복제가 이루어지므로 1GB당 2배의 할당량을 사용합니다.
Persistent disk SSD (GB). 이 할당량은 한 리전에서 만들 수 있는 SSD 지원 영구 디스크 파티션의 총 크기입니다. SSD 지원 영구 디스크에는 복제본이 여러 개 있으며 블록 스토리지 성능에서 설명한 대로 표준 영구 디스크보다 IOPS 및 처리량이 더 높습니다. SSD 지원 영구 디스크는 동일한 영역 내에서 VM에 연결할 수 있도록 무기한 제공됩니다. gcloud CLI 및 API에서는 이 할당량을 SSD_TOTAL_GB라고 합니다. 이 할당량은 로컬 SSD와 별개입니다. 이 할당량은 다음 디스크 유형에 적용됩니다.
- 영역별 및 리전별 SSD 영구 디스크
- 영역별 및 리전별 균형 있는 영구 디스크
리전별 영구 디스크는 한 리전 내의 두 영역에서 복제가 이루어지므로 1GB당 2배의 할당량을 사용합니다.

CPU 할당량 한도

CPU 할당량은 리전의 모든 VM 인스턴스에 있는 총 가상 CPU 수를 나타냅니다. CPU 할당량은 실행 중인 VM과 VM 예약에 적용됩니다. 사전 정의 및 선점형 VM 둘 다 이 할당량을 사용합니다.

Compute Engine 시스템과 다른 사용자를 보호하기 위해 일부 새 계정 및 프로젝트에는 모든 리전에 적용되는 전역 CPUs (All Regions) 할당량도 있습니다. 이 할당량은 모든 리전에 있는 vCPU의 합계로 측정됩니다.

예를 들어 us-central1과 같은 리전 한 곳에 vCPU가 48개 남아 있지만 CPUs (All Regions) 할당량에 vCPU가 32개만 남아 있다면 us-central1 리전에 할당량이 남아 있더라도 vCPU 32개만 실행할 수 있습니다. 그 이유는 CPU (All Regions) 할당량에 도달하여 새 인스턴스를 실행하려면 기존 인스턴스를 삭제해야 하기 때문입니다.

E2 및 N1 머신 유형은 CPU 할당량 풀을 공유합니다. 달리 명시되지 않는 한, 다른 모든 머신 유형은 고유한 별도의 CPU 할당량 풀을 갖게 됩니다.

VM에 약정 사용 할인을 사용하는 경우 약정 사용 할인 계약을 구매하려면 약정 사용 할인 할당량이 있어야 합니다.

머신 유형	할당량 풀	CPU 할당량 이름	약정된 CPU 할당량 이름
N1	공유 풀	`CPUS`	`Committed_CPUS`
E2	공유 풀	`CPUS`	`Committed_E2_CPUS`
N2	개별 풀	`N2_CPUS`	`Committed_N2_CPUS`
N2D	개별 풀	`N2D_CPUS`	`Committed_N2D_CPUS`
T2D	개별 풀	`T2D_CPUS`	`Committed_T2D_CPUS`
T2A	개별 풀	`T2A_CPUS`	T2A에 사용할 수 없음(N/A)
Z3(프리뷰)	개별 풀	`CPUS_PER_VM_FAMILY`	`Committed_Z3_CPUS`
M1	개별 풀	`M1_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M2	개별 풀	`M2_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M3	개별 풀	`M3_CPUS`	`Committed_M3_CPUS`
H3	개별 풀	`CPUS_PER_VM_FAMILY`	`Committed_H3_CPUS`
C2	개별 풀	`C2_CPUS`	`Committed_C2_CPUS`
C2D	개별 풀	`C2D_CPUS`	`Committed_C2D_CPUS`
C3	개별 풀	`C3_CPUS`	`Committed_C3_CPUS`
C3D	개별 풀	`CPUS_PER_VM_FAMILY`	`Committed_C3D_CPUS`
선점형 VM	공유 풀	`PREEMPTIBLE_CPUS`	선점형 VM에 사용할 수 없음(N/A)

GPU 할당량

가상 CPU 할당량과 비슷하게 GPU 할당량은 리전의 모든 VM 인스턴스에 있는 총 가상 GPU 수를 나타냅니다. GPU 할당량은 실행 중인 VM 및 VM 예약에 적용됩니다. 사전 정의 및 선점형 VM 둘 다 이 할당량을 사용합니다.

프로젝트에 사용 가능한 GPU가 충분히 있는지 확인하고 할당량 상향 조정을 요청하려면 할당량 페이지를 확인하세요. 또한 새 계정과 프로젝트에는 모든 리전에 적용되는 글로벌 GPU 할당량이 포함됩니다.

GPU 할당량을 요청하는 경우 각 리전에 생성하려는 GPU 모델의 할당량 외에도 모든 리전에 있는 모든 유형의 총 GPU 수에 적용할 전역 할당량(GPUs (all regions))을 추가로 요청해야 합니다. 이러한 리소스를 사용하려면 선점형 GPU 할당량을 요청하세요.

NVIDIA	GPU 할당량 이름	약정 GPU 할당량 이름	가상 워크스테이션	선점형 GPU	선점형 GPU 가상 워크스테이션
H100 80GB	`NVIDIA_H100_GPUS`	`COMMITTED_NVIDIA_H100_GPUS`	해당 사항 없음	`PREEMPTIBLE_NVIDIA_H100_GPUS`	해당 사항 없음
A100 40GB	`NVIDIA_A100_GPUS`	`COMMITTED_NVIDIA_A100_GPUS`	해당 사항 없음	`PREEMPTIBLE_NVIDIA_A100_GPUS`	해당 사항 없음
A100 80GB	`NVIDIA_A100_80GB_GPUS`	`COMMITTED_NVIDIA_A100_80GB_GPUS`	해당 사항 없음	`PREEMPTIBLE_NVIDIA_A100_80GB_GPUS`	해당 사항 없음
L4	`NVIDIA_L4_GPUS`	`COMMITTED_NVIDIA_L4_GPUS`	`NVIDIA_L4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_L4_GPUS`	`PREEMPTIBLE_NVIDIA_L4_VWS_GPUS`
T4	`NVIDIA_T4_GPUS`	`COMMITTED_NVIDIA_T4_GPUS`	`NVIDIA_T4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_T4_GPUS`	`PREEMPTIBLE_NVIDIA_T4_VWS_GPUS`
V100	`NVIDIA_V100_GPUS`	`COMMITTED_NVIDIA_V100_GPUS`	해당 사항 없음	`PREEMPTIBLE_NVIDIA_V100_GPUS`	해당 사항 없음
P100	`NVIDIA_P100_GPUS`	`COMMITTED_NVIDIA_P100_GPUS`	`NVIDIA_P100_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P100_GPUS`	`PREEMPTIBLE_NVIDIA_P100_VWS_GPUS`
P4	`NVIDIA_P4_GPUS`	`COMMITTED_NVIDIA_P4_GPUS`	`NVIDIA_P4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P4_GPUS`	`PREEMPTIBLE_NVIDIA_P4_VWS_GPUS`
K80	`NVIDIA_K80_GPUS`	`COMMITTED_NVIDIA_K80_GPUS`	해당 사항 없음	`PREEMPTIBLE_NVIDIA_K80_GPUS`	해당 사항 없음

선점형 리소스의 배정 할당량

선점형 VM 인스턴스에 연결된 선점형 CPU 또는 GPU를 사용하거나 선점형 VM 인스턴스에 연결된 로컬 SSD를 사용하려면 프로젝트에 해당 리소스에 대하여 사용 가능한 할당량이 있어야 합니다.

Preemptible CPUs, Preemptible GPUs 또는 Preemptible Local SSDs (GB)용 선점형 특별 할당량을 요청할 수 있습니다. 하지만 프로젝트에 선점형 할당량이 없고 선점형 할당량을 요청한 적이 없는 경우 표준 할당량을 사용하여 선점형 리소스를 실행할 수 있습니다.

Compute Engine이 리전에 선점형 할당량을 부여하면 자동으로 모든 선점형 인스턴스가 선점형 할당량에 반영됩니다. 이 할당량은 소진되므로 해당 리소스에 대한 선점형 할당량을 요청해야 합니다.

외부 IP 주소

VM마다 공개 인터넷에서 직접 연결하는 데 필요한 외부 IP 주소가 충분히 있어야 합니다. 리전 IP 할당량은 해당 리전의 VM에 IPv4 주소를 할당하는 데 사용되며, 전역 IP 할당량은 부하 분산기와 같은 전역 네트워킹 리소스에 IPv4 주소를 할당하는 데 사용됩니다. Google Cloud에서는 용도에 따라 다양한 유형의 IP 주소를 제공합니다. 비용에 대한 자세한 내용은 외부 IP 주소 가격 책정을 참조하세요. 구체적인 할당량에 대한 자세한 내용은 할당량 및 한도를 참조하세요.

사용 중인 외부 IP 주소. 리소스에서 사용하고 있는 임시 및 고정 IP 주소가 둘 다 포함됩니다.

참고 동일한 IP 주소가 2개 이상의 전달 규칙에 할당된 경우 Google Cloud는 사용되는 IP 주소 객체의 고유한 개수가 아니라 IN_USE_ADDRESSES 할당량에 대한 각 주소의 사용량을 계산하고 추가합니다.
고정 외부 IP 주소: 머신 재시작을 거쳐도 유지되며 리소스용으로 예약하는 외부 IP 주소입니다. DNS 및 도메인 제공업체 서비스로 이러한 주소를 등록하여 사용자 친화적인 주소(예: www.example-site.com)를 제공할 수 있습니다.
고정 내부 IP 주소: 고정 내부 IP 주소를 사용하면 서브넷에 구성된 내부 IP 범위에서 내부 IP 주소를 예약할 수 있습니다. 필요에 따라 예약한 내부 주소를 리소스에 할당할 수 있습니다.

할당량 적용

Google Cloud에서 리소스 및 API의 기본 할당량을 변경하는 경우가 가끔 있습니다. 이러한 변경사항은 점진적으로 적용됩니다. 새 기본 할당량이 적용되는 동안 Google Cloud 콘솔에 표시되는 최대 할당량에는 사용 가능한 실제 최대 할당량이 반영되지 않을 수 있습니다.

예를 들어 Google Cloud가 방화벽 규칙의 기본 최대 할당량을 200에서 300으로 변경하고 Google Cloud 콘솔을 사용하여 할당량을 확인한다면 300의 새 할당량이 표시될 수 있습니다. 하지만 실제 할당량은 적용이 완료될 때까지 200입니다.

진행 중인 할당량 적용에 대한 자세한 내용은 알려진 문제를 참조하세요. 문제를 설명하지 않으면 할당량 적용이 진행되지 않습니다.

할당량 적용이 진행 중이고 사용 가능한 실제 최대 할당량을 확인하려면 Google Cloud CLI를 사용하여 할당량을 확인합니다. 액세스할 수 있는 것보다 많은 할당량이 필요하면 할당량 상향 요청을 제출하세요.

배정 할당량

배정 할당량

할당량 및 리소스 가용성

배정 할당량

리전 및 전역 할당량

VM 인스턴스

인스턴스 그룹

디스크 할당량

CPU 할당량 한도

GPU 할당량

선점형 리소스의 배정 할당량

외부 IP 주소

할당량 적용

다음 단계