Erros de cota de GPU

Ao criar instâncias de VM confidencial com GPUs NVIDIA H100 na série de máquinas A3, você pode encontrar os seguintes erros relacionados a cotas de GPU.

Cota regional insuficiente

Esse erro ocorre quando uma solicitação excede a cota de GPU disponível em uma região específica.

Exemplo de mensagem de erro:

RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION

No console do Google Cloud , as mensagens de erro de cota de GPU podem mostrar um nome de cota genérico, como GPUS_PER_GPU_FAMILY, em vez do tipo específico que você precisa aumentar. Para instâncias de VM confidenciais com GPUs, esse nome de cota se refere à cota preemptiva.

Para solicitar um aumento na cota de GPUs preemptivas NVIDIA H100 regionais, consulte Solicitar cota preemptiva.

Cota global insuficiente

Esse erro ocorre quando o uso total de GPU em todas as regiões excede a cota global de GPU.

Exemplo de mensagem de erro:

RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally

Para solicitar um aumento de cota global, consulte Solicitar cota global.