Soluciona errores de disponibilidad de recursos


En este documento, se describe cómo resolver los errores de disponibilidad de recursos que pueden ocurrir cuando intentas solicitar recursos nuevos de Compute Engine o crear reservas de recursos de Compute Engine. Los errores de recursos se producen cuando intentas solicitar recursos nuevos en una zona que no puede admitir tu solicitud debido a la falta de disponibilidad actual de un recurso de Compute Engine, como GPU o CPU.

Los errores de recursos solo se aplican a las solicitudes de recursos nuevas de la zona y no afectan a los recursos existentes. Los errores de recursos no están relacionados con tu cuota de Compute Engine y solo se aplican al recurso que especificaste en tu solicitud cuando enviaste la solicitud, no a todos los recursos de la zona.

Mensajes de error comunes:

Los siguientes son ejemplos de errores de recursos comunes que puedes encontrar cuando solicitas recursos nuevos de Compute Engine o creas reservas nuevas:

ZONE_RESOURCE_POOL_EXHAUSTED
ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS
The zone 'projects/PROJECT_ID/zones/ZONE' does not have enough resources available to fulfill the request.
Try a different zone, or try again later.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone.

Capacity changes frequently, so try your request in a different zone, with a different VM hardware
configuration, or at a later time. For more options, see troubleshooting documentation.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone, because of  REASON.

Consider trying your request in the ZONE zone(s), which currently has capacity to accommodate your request.

If you cannot move your VM to ZONE, review the REASON failure resolution instructions available in troubleshooting documentation, then try your request again.
If your workload can't accommodate the suggested resolution, try your request with a different VM hardware configuration or at a later time.

Algunos mensajes de error incluyen un campo reason que proporciona información sobre el recurso específico que Compute Engine no pudo entregar a partir de tu solicitud. Consulta la sección Motivos y recomendaciones de los errores de recursos de este documento para obtener más información sobre los motivos por los que se producen los errores de recursos y las estrategias de resolución para cada error reason.

Resuelve errores de recursos

En general, la mejor manera de resolver un error de recursos es volver a intentar la solicitud en una zona diferente, en un momento diferente o con una configuración de VM diferente. Si el mensaje de error que recibiste incluye un campo reason, puedes encontrar recomendaciones de soluciones específicas para ayudarte a resolver el error en la sección Motivos y recomendaciones de los errores de recursos de este documento.

Si intentas crear un grupo de instancias administrado zonal (MIG) con VMs de GPU, crea una solicitud de cambio de tamaño en el MIG. Las solicitudes de cambio de tamaño son útiles para obtener recursos con alta demanda de una sola vez en un MIG y ejecutar las VMs durante un momento específico. Especificar la duración de la ejecución mejora la disponibilidad de los recursos muy solicitados y evita cargos innecesarios.

Si intentas crear un MIG regional, cambia la forma de distribución del MIG a BALANCED, ANY o ANY_SINGLE_ZONE. Para obtener más información sobre las formas de distribución, consulta Forma de distribución objetivo del MIG regional.

Si intentas crear VMs Spot (o VMs interrumpibles heredadas), recuerda que estas son de capacidad libre, que no es planificada y es volátil, por lo que es posible que no se puedan obtener durante los períodos de demanda máxima. En consecuencia, las VMs Spot solo se recomiendan para cargas de trabajo con requisitos de tiempo flexible, ubicación y configuración de VM. Puedes ayudar a evitar este error de las VMs Spot si sigues las prácticas recomendadas a fin de que tu carga de trabajo sea más flexible. Si este error persiste, usa una VM estándar en su lugar.

La mejor manera de evitar errores de recursos es crear reservas de Compute Engine con anticipación. Las reservas ayudan a garantizar que los recursos estén disponibles cuando los necesites.

Motivos y recomendaciones de los errores de recursos

En la siguiente tabla, se proporciona información sobre el campo reason presente en algunos mensajes de error de recursos y recomendaciones sobre estrategias de resolución para cada reason.

Error reason Descripción Recomendación
resource_availability Actualmente, el tipo y el tamaño de la VM que solicitaste no están disponibles en la zona en la que la solicitaste.

Prueba una de las siguientes opciones:

  • Solicita la VM en otra zona.
  • Si recibes un error de disponibilidad de recursos cuando solicitas un tipo de máquina a3-highgpu-1g, a3-highgpu-2g o a3-highgpu-4g, asegúrate de aprovisionar la VM con uno de estos métodos compatibles.
cpu_availability Actualmente, no hay una VM con la cantidad de CPU que solicitaste disponible en la zona en la que la solicitaste.

Prueba una de las siguientes opciones:

  • Si solicitas una sola VM, solicítala en otra zona.
  • Si solicitas varias VMs, prueba una o más de las siguientes opciones:

    • Solicita las VMs en otra zona.
    • Divide la cantidad total de CPUs virtuales en las VMs más pequeñas. Por ejemplo, si solicitaste 80 VMs con 224 CPUs virtuales, intenta solicitar 160 VMs con 128 CPUs virtuales cada una.
memory_availability Actualmente, no hay una VM con la cantidad de memoria que solicitaste disponible en la zona en la que la solicitaste.

Prueba una de las siguientes opciones:

  • Si solicitas una sola VM, solicítala en otra zona.
  • Si solicitas varias VMs, prueba una o más de las siguientes opciones:

    • Solicita las VMs en otra zona.
    • Divide la solicitud de memoria en varias VMs. Por ejemplo, si solicitaste tres VMs con 1.88 TB de memoria cada una, divide la solicitud en varias VMs que tengan una memoria combinada total de 1.88 TB.
local_ssd_availability Actualmente, no hay una VM con la cantidad de SSD local que solicitaste disponible en la zona en la que la solicitaste.

Prueba una de las siguientes opciones:

  • Si solicitas una sola VM, solicítala en otra zona.
  • Si solicitas varias VMs, prueba una o más de las siguientes opciones:

    • Solicita las VMs en otra zona.
    • Si tu carga de trabajo lo permite, solicita un disco persistente SSD zonal o regional en lugar de un SSD local.
    • Divide tu solicitud SSD local en varias VMs. Por ejemplo, si solicitaste una VM con 600 GB de SSD local, divide la solicitud en varias VMs que tengan un SSD local combinado total de 600 GB.
gpu_availability Actualmente, no hay una VM con la GPU que solicitaste disponible en la zona en la que la solicitaste. Intenta solicitar la VM en otra zona.

Si no pudiste resolver el error con ninguna de las recomendaciones de resolución anteriores, intenta obtener asistencia.