在 A3 机器系列上创建使用 NVIDIA H100 GPU 的机密虚拟机实例时,您可能会遇到与 GPU 配额相关的以下错误。
区域配额不足
当请求超出特定区域中的可用 GPU 配额时,会发生此错误。
错误消息示例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION
在 Google Cloud 控制台中,GPU 配额错误消息可能会显示一般配额名称(例如 GPUS_PER_GPU_FAMILY
),而不是您需要增加的具体配额类型。对于使用 GPU 的机密虚拟机实例,此配额名称是指抢占式配额。
如需申请增加区域级抢占式 NVIDIA H100 GPU 配额,请参阅申请抢占式配额。
全局配额不足
当您在所有区域中的 GPU 总使用量超过全局 GPU 配额时,就会发生此错误。
错误消息示例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally
如需申请增加全局配额,请参阅申请全局配额。