리소스 가용성 오류 문제 해결


이 문서에서는 새 Compute Engine 리소스를 요청하거나 Compute Engine 리소스 예약을 만들려고 시도할 때 발생할 수 있는 리소스 가용성 오류를 해결하는 방법을 설명합니다. GPU 또는 CPU와 같은 Compute Engine 리소스를 현재 사용할 수 없어서 요청을 처리할 수 없는 영역에서 리소스를 요청하려고 하면 오류가 발생합니다.

리소스 오류는 영역의 새 리소스 요청에만 적용되며 기존 리소스에는 영향을 미치지 않습니다. 리소스 오류는 Compute Engine 할당량과 관련이 없으며, 요청을 보낼 때 영역의 모든 리소스가 아닌 요청에 지정된 리소스에만 적용됩니다.

일반적인 오류 메시지

다음은 새 Compute Engine 리소스를 요청하거나 새 예약을 만들 때 발생할 수 있는 일반적인 리소스 오류 예시입니다.

ZONE_RESOURCE_POOL_EXHAUSTED
ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS
The zone 'projects/PROJECT_ID/zones/ZONE' does not have enough resources available to fulfill the request.
Try a different zone, or try again later.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone.

Capacity changes frequently, so try your request in a different zone, with a different VM hardware
configuration, or at a later time. For more options, see troubleshooting documentation.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone, because of  REASON.

Consider trying your request in the ZONE zone(s), which currently has capacity to accommodate your request.

If you cannot move your VM to ZONE, review the REASON failure resolution instructions available in troubleshooting documentation, then try your request again.
If your workload can't accommodate the suggested resolution, try your request with a different VM hardware configuration or at a later time.

일부 오류 메시지에는 Compute Engine이 요청으로 수행할 수 없는 특정 리소스에 대한 정보를 제공하는 reason 필드가 포함됩니다. 이 문서의 리소스 오류 이유 및 권장사항 섹션을 보고 리소스 오류가 발생한 이유 및 각 오류 reason에 대한 해결 전략을 알아봅니다.

리소스 오류 해결

일반적으로 리소스 오류를 해결하는 가장 좋은 방법은 서로 다른 영역, 서로 다른 시간, 서로 다른 VM 구성으로 요청을 재시도하는 것입니다. 수신된 오류 메시지에 reason 필드가 포함된 경우 이 문서의 리소스 오류 이유 및 권장사항 섹션에서 오류 해결에 도움이 되는 특정 해결 권장사항을 찾을 수 있습니다.

GPU VM이 있는 영역 관리형 인스턴스 그룹(MIG)을 만들려고 시도하는 경우 MIG에서 크기 조절 요청을 만듭니다. 크기 조절 요청은 MIG에서 수요가 많은 리소스를 한 번에 확보하여 특정 시간 동안 VM을 실행하는 데 유용합니다. 실행 기간을 지정하면 수요가 많은 리소스의 획득 가능성이 향상되고 불필요한 비용이 방지됩니다.

리전 MIG를 만들려는 경우 MIG 분산 형태를 BALANCED, ANY 또는 ANY_SINGLE_ZONE으로 변경해 봅니다. 배포 모양에 대한 자세한 내용은 리전별 MIG 대상 배포 모양을 참조하세요.

스팟 VM(또는 기존 선점형 VM)을 만드는 경우 이러한 VM은 계획되지 않은 휘발성 여유 용량이므로 최대 수요 기간에 얻지 못할 수 있습니다. 따라서 스팟 VM을 유연한 시간, 위치, VM 구성 요구사항이 있는 워크로드에만 사용하는 것이 좋습니다. 워크로드 유연성을 높이기 위한 권장사항을 수행하면 스팟 VM에서 이 오류를 방지할 수 있습니다. 이 오류가 계속되면 대신 표준 VM을 사용합니다.

리소스 오류를 방지하는 가장 좋은 방법은 리소스가 필요하기 전에 미리 Compute Engine 예약을 만드는 것입니다. 예약을 통해 필요할 때 리소스를 사용할 수 있습니다.

리소스 오류 이유 및 권장사항

다음 테이블에서는 일부 리소스 오류 메시지에 제공되는 reason 필드 및 각 reason의 해결 전략에 대한 권장사항이 제공됩니다.

오류 reason 설명 권장사항
resource_availability 요청한 VM 유형 및 크기가 요청한 영역에서 현재 사용 가능한 상태가 아닙니다. 다른 영역에서 VM을 요청해 보세요.
cpu_availability 요청한 CPU 양이 포함된 VM이 이를 요청한 영역에서 현재 사용 가능한 상태가 아닙니다.

다음 중 하나를 선택하세요.

  • 단일 VM을 요청하는 경우 다른 영역에서 VM을 요청합니다.
  • 여러 VM을 요청하는 경우 다음 중 하나 이상을 시도합니다.

    • 다른 영역에서 VM을 요청합니다.
    • 총 vCPU 양을 더 작은 VM으로 분할합니다. 예를 들어 224개의 vCPU가 포함된 VM을 80개 요청한 경우 각각 128개의 vCPU가 포함된 VM을 160개 요청합니다.
memory_availability 요청한 메모리 양이 포함된 VM이 이를 요청한 영역에서 현재 사용 가능한 상태가 아닙니다.

다음 중 하나를 선택하세요.

  • 단일 VM을 요청하는 경우 다른 영역에서 VM을 요청합니다.
  • 여러 VM을 요청하는 경우 다음 중 하나 이상을 시도합니다.

    • 다른 영역에서 VM을 요청합니다.
    • 메모리 요청을 여러 개의 VM으로 분할합니다. 예를 들어 각각 1.88TB 메모리가 포함된 VM을 3개 요청한 경우 총합 메모리가 1.88TB에 해당하는 여러 개의 VM으로 요청을 분할합니다.
local_ssd_availability 요청한 로컬 SSD 양이 포함된 VM이 이를 요청한 영역에서 현재 사용 가능한 상태가 아닙니다.

다음 중 하나를 선택하세요.

  • 단일 VM을 요청하는 경우 다른 영역에서 VM을 요청합니다.
  • 여러 VM을 요청하는 경우 다음 중 하나 이상을 시도합니다.

    • 다른 영역에서 VM을 요청합니다.
    • 워크로드로 허용되는 경우 로컬 SSD 대신 영역별 또는 리전별 SSD 영구 디스크를 요청합니다.
    • 로컬 SSD 요청을 여러 개의 VM으로 분할합니다. 예를 들어 로컬 SSD가 600GB인 VM을 하나 요청한 경우 총합 로컬 SSD가 600GB에 해당하는 여러 개의 VM으로 요청을 분할합니다.
gpu_availability 요청한 GPU가 포함된 VM이 이를 요청한 영역에서 현재 사용 가능한 상태가 아닙니다. 다른 영역에서 VM을 요청해 보세요.

위 해결 권장사항을 사용하여 오류를 해결할 수 없으면 시작하기를 시도해 보세요.