리소스 할당량

Compute Engine은 다양한 이유로 리소스 사용량에 할당량을 적용합니다. 예를 들어 할당량은 사용량이 예기치 않게 급증하는 것을 방지하여 Google Cloud Platform 사용자 커뮤니티를 보호합니다. Google Cloud Platform은 무료 평가판 할당량도 제공하므로 프로젝트에 제한적으로 액세스하여 무료로 Google Cloud Platform을 살펴볼 수 있습니다.

모든 프로젝트의 할당량이 동일하지는 않습니다. Google Cloud Platform 사용량이 점차 늘어나면 할당량도 이에 따라 늘릴 수 있습니다. 앞으로 사용량이 현저하게 늘어날 것으로 예상되는 경우 GCP Console의 할당량 페이지에서 사전에 할당량 조정을 요청할 수 있습니다.

할당량 확인

프로젝트 리소스에 사용할 수 있는 할당량을 확인하려면 Google Cloud Platform Console의 할당량 페이지로 이동합니다.

gcloud 명령줄 도구를 사용한다면 다음 명령어를 실행하여 프로젝트 전체의 할당량을 확인합니다. myproject를 내 프로젝트 ID로 바꿉니다.

gcloud compute project-info describe --project myproject

리전별 할당량은 나열되지 않습니다. 할당량을 리전별로 나열하는 방법은 다음과 같습니다.

gcloud compute regions describe [REGION]

[REGION]을 할당량 정보를 나열할 리전으로 바꿉니다.

할당량 증가 요청

GCP Console의 할당량 페이지에서 할당량 변경을 요청합니다. 할당량 증가 요청에는 요금이 부과되지 않습니다. 리소스를 더 사용한 경우에만 요금이 증가합니다.

할당량 수정 권한

할당량을 변경하려면 serviceusage.quotas.update 권한이 있어야 합니다. 이 권한은 사전 정의된 역할인 소유자, 편집자, 할당량 관리자에 기본적으로 포함되어 있습니다.

할당량 변경 요청

  1. 할당량 페이지로 이동합니다.

    할당량 페이지로 이동

  2. 할당량 페이지에서 변경할 할당량을 선택합니다.
  3. 페이지 상단의 할당량 수정 버튼을 클릭합니다.
  4. 수정할 서비스의 체크박스를 선택합니다.
  5. 이름, 이메일, 전화번호를 입력하고 다음을 클릭합니다.
  6. 할당량 증가를 위한 요청 내용을 입력하고 다음을 클릭합니다.
  7. 요청을 제출합니다.
  8. 할당량 감소 요청은 기본적으로 거부됩니다. 할당량을 꼭 줄여야 한다면 지원 이메일에 답장하여 요구사항을 설명해 주시기 바랍니다. 지원팀 담당자가 요청에 대한 답변을 드립니다.

요청 후 24~48시간 내에 Compute Engine팀이 답변을 드립니다.

요청을 이행하는 데 충분한 시간을 확보할 수 있도록 최소 며칠 전에 리소스 추가를 계획하고 요청하시기 바랍니다.

할당량 및 리소스 가용성

리소스 할당량이란 해당 리소스를 사용할 수 있는 경우 이 리소스 유형으로 만들 수 있는 최대 리소스 수입니다. 할당량이 있다고 해서 이러한 리소스가 항상 제공되는 것은 아닙니다. 리소스를 사용할 수 없거나 선택한 리전에 리소스가 없다면 리전이나 프로젝트에 할당량이 남아 있더라도 이 유형으로 새 리소스를 만들 수 없습니다. 예를 들어 us-central1에 새 외부 IP 주소를 만들 수 있는 할당량이 아직 남아 있지만 해당 리전에 사용 가능한 IP 주소가 없을 수도 있습니다.

마찬가지로 리전 할당량이 있더라도 특정 영역에 리소스가 제공되지 않을 수 있습니다. 예를 들어 us-central1 리전에 VM 인스턴스를 만들 수 있는 할당량이 있지만 us-central1-a 영역이 고갈되었다면 이 영역에서 VM 인스턴스를 만들 수 없습니다. 이러한 경우 us-central1-f와 같은 다른 영역에서 동일한 리소스를 만들어 보세요.

리소스가 리전 수준에서 고갈되는 경우는 매우 드뭅니다. 이러한 경우 어떤 조치를 취할 수 있는지 알아보려면 Compute Engine SLA를 참조하세요.

VM, CPU, IP 주소 할당량 이해

필요한 가상 머신(VM) 인스턴스를 계획할 때, 만들 수 있는 VM 인스턴스 개수에 영향을 미치는 여러 할당량을 고려해야 합니다.

리전 및 글로벌 할당량

VM 할당량은 리전 수준에서 관리됩니다. VM 인스턴스, 인스턴스 그룹, CPU, 디스크 할당량을 영역에 관계없이 리전의 모든 VM에서 사용할 수 있습니다. 예를 들어 CPU 할당량은 리전 할당량이므로 리전마다 한도와 사용량 집계가 다릅니다. us-central1 리전에 있는 영역에서 n1-standard-16 인스턴스를 실행하려면 us-central1에 CPU 16개 이상의 할당량이 필요합니다.

네트워킹과 부하 분산 할당량은 방화벽, 부하 분산기, 네트워크, VPN을 만드는 데 필요하며, 리전에 따라 달라지지 않는 글로벌 할당량입니다. 모든 리전에서 글로벌 할당량을 사용할 수 있습니다. 예를 들어 부하 분산기와 HTTP 또는 HTTPS 프록시에 할당되어 사용 중인 고정 외부 IP 주소는 글로벌 할당량을 사용합니다.

CPU

CPU 할당량은 리전에서 실행 중인 모든 VM 인스턴스에 있는 총 가상 CPU 수를 나타냅니다. CPU 할당량은 실행 중인 인스턴스에만 적용됩니다. 일반 및 선점형 인스턴스 둘 다 이 할당량을 사용합니다.

Compute Engine 시스템과 다른 사용자를 보호하기 위해 일부 새 계정 및 프로젝트에는 모든 리전에 적용되는 글로벌 CPUs (All Regions) 할당량도 있으며 모든 리전에서 실행 중인 vCPU의 합계로 측정됩니다.

예를 들어 us-central1과 같은 리전 한 곳에 vCPU가 48개 남아 있지만 CPUs (All Regions) 할당량에 vCPU가 32개만 남아 있다면, us-central1 리전에 할당량이 남아 있더라도 vCPU 32개만 실행할 수 있습니다. 그 이유는 CPU (All Regions) 할당량에 도달하여 새 인스턴스를 실행하려면 기존 인스턴스를 삭제해야 하기 때문입니다.

GPU

가상 CPU 할당량과 비슷하게 GPU 할당량은 리전의 모든 VM 인스턴스에 있는 총 가상 GPU 수를 나타냅니다. 프로젝트에 사용 가능한 GPU가 충분히 있는지 확인하고 할당량 상향 조정을 요청하려면 할당량 페이지를 확인하세요. 또한 새 계정과 프로젝트에는 모든 리전에 적용되는 글로벌 GPU 할당량이 포함됩니다.

GPU 할당량을 요청하는 경우 각 리전에 생성하려는 GPU 모델의 할당량과 함께, 전 영역 내 모든 유형의 총 GPU에 적용할 글로벌 할당량을 추가로 요청해야 합니다.

VM 인스턴스

VM 인스턴스 할당량은 리전 할당량이며 VM 실행 여부에 관계없이 특정 리전에 존재할 수 있는 VM 인스턴스의 개수를 제한합니다. 이 할당량은 Google Cloud Platform Console에 표시되지 않지만 Compute Engine에서 자동으로 일반 CPU 할당량의 10배로 설정합니다. 따라서 이 할당량을 요청할 필요가 없습니다. 더 많은 VM 인스턴스 할당량이 필요하면 CPU를 더 많이 요청해야 합니다. 그러면 VM 인스턴스 할당량도 늘어납니다. 이 할당량은 VM(실행 여부 무관), 일반 인스턴스, 선점형 인스턴스에 적용됩니다.

선점형 리소스의 할당량

선점형 VM 인스턴스에 연결된 선점형 CPU 또는 GPU를 사용하거나 선점형 인스턴스에 연결된 로컬 SSD를 사용하려면 각 리소스의 프로젝트에 사용 가능한 할당량이 있어야 합니다.

Preemptible CPUs, Preemptible GPUs, Preemptible Local SSDs (GB)용 선점형 특별 할당량을 요청할 수 있습니다. 하지만 프로젝트에 선점형 할당량이 없어도 일반 할당량을 사용하여 선점형 리소스를 실행할 수 있습니다.

Compute Engine이 리전에 선점형 할당량을 부여하면 자동으로 모든 선점형 인스턴스가 선점형 할당량에 반영됩니다.

디스크 할당량

다음 영구 디스크 및 로컬 SSD 할당량은 리전별로 적용됩니다.

  • Local SSD (GB) - 한 리전에서 VM에 연결할 수 있는 로컬 SSD 디스크 파티션을 합친 총 크기입니다. 로컬 SSD는 VM 인스턴스 재부팅 시 디스크가 유지되지 않으므로 내결함성이 높은 스크래치, 로컬 캐시 또는 처리 작업에 사용해야 하는 빠른 이페머럴 디스크입니다. 로컬 SSD 파티션은 375GB 단위로 판매되며 VM 1개에 최대 8개의 로컬 SSD 파티션을 연결할 수 있습니다. gcloud 도구 및 API에서는 LOCAL_SSD_TOTAL_GB라고 합니다.

  • Persistent Disk Standard (GB) - 한 리전에서 만들 수 있는 표준 영구 디스크의 총 크기입니다. 영구 디스크 및 로컬 SSD 성능 최적화에서 설명한 대로, 표준 영구 디스크는 SSD 영구 디스크 또는 로컬 SSD보다 IOPS 및 처리량이 낮습니다. 이 디스크는 내구성 있는 대규모 저장 디스크로, 부팅 디스크로, 그리고 연속 쓰기 프로세스(예: 로그)에 사용되는 경우에 비용 효율적입니다. 표준 영구 디스크는 내구성이 있으며 동일한 영역 내에서 VM에 연결할 수 있도록 무기한 제공됩니다. gcloud 도구 및 API에서는 DISKS_TOTAL_GB라고 합니다. 이 할당량은 리전 표준 영구 디스크에도 적용되며, 리전 디스크는 한 리전 내의 두 영역에서 복제가 이루어지므로 GB당 2배의 할당량을 사용합니다.

  • Persistent Disk SSD (GB) - 한 리전에서 만들 수 있는 SSD 영구 디스크 파티션의 총 크기입니다. SSD 영구 디스크에는 복제본이 여러 개 있으며 영구 디스크 및 로컬 SSD 성능 최적화에서 설명한 대로 표준 영구 디스크보다 IOPS 및 처리량이 높습니다. SSD 영구 디스크는 I/O 요구사항이 높고 내구성 있는 저장소로 사용되는 경우에 비용 효율적입니다. SSD 영구 디스크는 동일한 영역 내에서 VM에 연결할 수 있도록 무기한 제공됩니다. gcloud 도구 및 API에서는 SSD_TOTAL_GB라고 합니다. 이 할당량은 로컬 SSD와 별도입니다. 이 할당량은 리전 SSD 영구 디스크에도 적용되며, 리전 디스크는 한 리전 내의 두 영역에서 복제가 이루어지므로 GB당 2배의 할당량을 사용합니다.

IP 주소

VM마다 공개 인터넷에서 연결하는 데 필요한 IP 주소가 충분히 있어야 합니다. 리전 IP 할당량은 해당 리전의 VM에 IPv4 주소를 할당하는 데 사용되며, 글로벌 IP 할당량은 HTTP 프록시 및 부하 분산기와 같은 글로벌 네트워킹 리소스에 IPv4 주소를 할당하는 데 사용됩니다. 용도에 따라 몇 가지 유형의 IP 주소를 고려해야 합니다.

  • 사용 중인 IP 주소: 현재 리소스에서 사용하고 있는 임시 및 고정 IP 주소가 둘 다 포함됩니다. 사용 중인 IP 주소에는 요금이 청구되지 않지만 사용하지 않는 고정 IP 주소에는 요금이 청구됩니다.
  • 고정 외부 IP 주소: 머신 재시작을 거쳐도 유지되며 리소스용으로 예약하는 외부 IP 주소입니다. DNS 및 도메인 제공업체 서비스로 이러한 주소를 등록하여 사용자 친화적인 주소(예: www.example-site.com)를 제공할 수 있습니다.
  • 고정 내부 IP 주소: 고정 내부 IP 주소는 서브넷에 구성된 비공개 RFC 1918 IP 범위에서 내부 IP 주소를 예약하는 기능을 제공합니다. 필요에 따라 예약한 내부 주소를 리소스에 할당할 수 있습니다.
이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

Compute Engine 문서