Solução de erros de disponibilidade de recursos


Neste documento, descrevemos como resolver erros de disponibilidade de recursos que podem ocorrer quando você tenta solicitar novos recursos do Compute Engine ou cria reservas de recursos. Erros de recurso ocorrem quando você tenta solicitar recursos em uma zona que não pode acomodar sua solicitação devido à indisponibilidade atual de um recurso do Compute Engine, como GPUs ou CPUs.

Os erros de recursos se aplicam apenas a novas solicitações de recursos na zona. Eles não afetam os recursos atuais. Os erros de recursos não estão relacionados à sua cota do Compute Engine e se aplicam apenas ao recurso especificado na solicitação, não a todos os recursos na zona.

Mensagens de erro comuns

Veja a seguir exemplos de erros comuns de recursos que podem ser encontrados ao solicitar novos recursos do Compute Engine ou criar novas reservas:

ZONE_RESOURCE_POOL_EXHAUSTED
ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS
The zone 'projects/PROJECT_ID/zones/ZONE' does not have enough resources available to fulfill the request.
Try a different zone, or try again later.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone.

Capacity changes frequently, so try your request in a different zone, with a different VM hardware
configuration, or at a later time. For more options, see troubleshooting documentation.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone, because of  REASON.

Consider trying your request in the ZONE zone(s), which currently has capacity to accommodate your request.

If you cannot move your VM to ZONE, review the REASON failure resolution instructions available in troubleshooting documentation, then try your request again.
If your workload can't accommodate the suggested resolution, try your request with a different VM hardware configuration or at a later time.

Algumas mensagens de erro incluem um campo reason que fornece informações sobre o recurso específico que o Compute Engine não conseguiu atender a partir da solicitação. Consulte a seção Motivos de erro de recursos e recomendações deste documento para saber mais sobre os motivos pelos quais erros de recursos ocorrem e estratégias de resolução para cada erro reason.

Resolver erros de recursos

Em geral, a melhor maneira de resolver um erro de recurso é repetir a solicitação em uma zona, horário ou configuração de VM diferentes. Se a mensagem de erro que você recebeu incluiu um campo reason, é possível encontrar recomendações específicas de correção na seção Motivos e recomendações de erros de recursos. deste documento.

Se você estiver tentando criar um grupo gerenciado de instâncias (MIG) zonal com VMs de GPU, crie uma solicitação de redimensionamento no MIG. As solicitações de redimensionamento são úteis para receber recursos com alta demanda de uma só vez em um MIG e executar as VMs por um período específico. Especificar a duração de execução melhora a capacidade de receber recursos com alta demanda e evita cobranças desnecessárias.

Se você estiver tentando criar um MIG regional, tente alterar a forma de distribuição de MIGs para BALANCED, ANY, ou ANY_SINGLE_ZONE. Para mais informações sobre formas de distribuição, consulte Forma regional de distribuição de MIG.

Se você estiver tentando criar VMs do Spot (ou VMs preemptivas legadas), lembre-se de que essas VMs têm capacidade extra, que não é planejada e volátil. Portanto, talvez elas não possam ser obtidas em períodos de pico de demanda. Consequentemente, as VMs do Spot são recomendadas apenas para cargas de trabalho com requisitos flexíveis de configuração de VM, local e horário. Ajude a evitar esse erro para VMs do Spot seguindo as práticas recomendadas para tornar sua carga de trabalho mais flexível. Se o erro persistir, use VMs padrão.

A melhor maneira de evitar erros de recursos é criar reservas do Compute Engine antes de precisar dos recursos. As reservas ajudam a garantir que os recursos estejam disponíveis quando você precisa deles.

Motivos e recomendações para erros de recursos

A tabela a seguir fornece informações sobre o campo de reason presente em algumas mensagens de erro de recursos e recomendações sobre estratégias de resolução para cada reason.

Error reason Descrição Recomendação
resource_availability O tipo e o tamanho da VM solicitada não estão disponíveis na zona em que você a solicitou.

Tente uma destas alternativas:

  • Solicite a VM em outra zona.
  • Se você receber um erro de disponibilidade de recursos ao solicitar um tipo de máquina a3-highgpu-1g, a3-highgpu-2g ou a3-highgpu-4g, confira se está provisionando a VM usando um destes métodos com suporte.
cpu_availability Uma VM com a quantidade de CPU solicitada está indisponível na zona em que você a solicitou.

Tente uma destas alternativas:

  • Se você estiver solicitando uma única VM, solicite em outra zona.
  • Se você estiver solicitando várias VMs, tente uma ou mais das seguintes opções:

    • Solicitar as VMs em outra zona.
    • Divida a quantidade total de vCPU em VMs menores. Por exemplo, se você solicitou 80 VMs com 224 vCPUs, tente solicitar 160 VMs com 128 vCPUs cada.
memory_availability Uma VM com a quantidade de memória solicitada não está disponível na zona em que você a solicitou.

Tente uma destas alternativas:

  • Se você estiver solicitando uma única VM, solicite em outra zona.
  • Se você estiver solicitando várias VMs, tente uma ou mais das seguintes opções:

    • Solicitar as VMs em outra zona.
    • Divida sua solicitação de memória em várias VMs. Por exemplo, se você solicitou três VMs com 1,88 TB de memória cada, divida a solicitação em várias VMs que tenham uma memória combinada total de 1,88 TB.
local_ssd_availability Uma VM com a quantidade de SSD local que você solicitou está indisponível no momento na zona em que você o solicitou.

Tente uma destas alternativas:

  • Se você estiver solicitando uma única VM, solicite em outra zona.
  • Se você estiver solicitando várias VMs, tente uma ou mais das seguintes opções:

    • Solicitar as VMs em outra zona.
    • Se a carga de trabalho permitir, solicite um disco permanente SSD zonal ou regional em vez de SSD local.
    • Divida sua solicitação SSD local em várias VMs. Por exemplo, se você solicitou uma VM com 600 GB de SSD local, divida a solicitação em várias VMs que têm um SSD local total combinado de 600 GB.
gpu_availability Uma VM com a GPU solicitada está indisponível na zona em que você a solicitou. Tente solicitar a VM em outra zona.

Se não foi possível resolver o erro usando nenhuma das recomendações de resolução anteriores, tente Receber suporte.