GPU 할당량 오류

A3 머신 시리즈에서 NVIDIA H100 GPU를 사용하여 컨피덴셜 VM 인스턴스를 만들 때 GPU 할당량과 관련된 다음 오류가 발생할 수 있습니다.

리전별 할당량 부족

이 오류는 요청이 특정 리전에서 사용 가능한 GPU 할당량을 초과할 때 발생합니다.

오류 메시지 예:

RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION

Google Cloud 콘솔에서 GPU 할당량 오류 메시지에 늘려야 하는 특정 할당량 유형 대신 GPUS_PER_GPU_FAMILY과 같은 일반 할당량 이름이 표시될 수 있습니다. GPU가 있는 컨피덴셜 VM 인스턴스의 경우 이 할당량 이름은 선점형 할당량을 나타냅니다.

리전별 선점형 NVIDIA H100 GPU 할당량 상향을 요청하려면 선점형 할당량 요청을 참고하세요.

전역 할당량 부족

이 오류는 모든 리전의 총 GPU 사용량이 전역 GPU 할당량을 초과할 때 발생합니다.

오류 메시지 예:

RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally

전역 할당량 상향을 요청하려면 전역 할당량 요청을 참고하세요.