在 A3 機器系列上使用 NVIDIA H100 GPU 建立機密 VM 執行個體時,可能會遇到下列與 GPU 配額相關的錯誤。
區域配額不足
如果要求超出特定區域的可用 GPU 配額,就會發生這個錯誤。
錯誤訊息範例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION
在 Google Cloud 控制台中,GPU 配額錯誤訊息可能會顯示一般配額名稱 (例如 GPUS_PER_GPU_FAMILY
),而不是您需要增加的特定配額類型。如果是搭載 GPU 的機密 VM 執行個體,這個配額名稱是指先占配額。
如要申請提高區域先占 NVIDIA H100 GPU 配額,請參閱「申請先占配額」。
全球配額不足
如果所有區域的 GPU 總用量超出全域 GPU 配額,就會發生這個錯誤。
錯誤訊息範例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally
如要申請提高全域配額,請參閱申請全域配額。