Soluciona problemas de usuario único


En esta página, se describe cómo solucionar algunos problemas potenciales que pueden ocurrir cuando usas nodos de usuario único.

Limitación del tamaño del grupo de nodos

  • Problema: El tamaño de un grupo de nodos se limita a 100.

    • Solución: Crea varios grupos de nodos y usa la misma etiqueta de afinidad para cada uno. Luego, cuando programes las VM en estos grupos de nodos, usa la etiqueta de afinidad que les asignaste.

Fallas de programación de VM

  • Problema: No se puede programar una VM en un nodo de usuario único.

    • Solución:

      • No puedes programar una VM de usuario único si no hay un nodo en la zona que coincida con la especificación de afinidad o antiafinidad de la VM. Comprueba que hayas especificado las etiquetas de afinidad correctas. Además, comprueba que no hayas especificado ninguna etiqueta de afinidad en conflicto.

      • Si usas la política de mantenimiento de reinicio en su ubicación, verifica que la configuración OnHostMaintenance de la VM esté configurada como terminate.

      • Si usas la política de mantenimiento de migración en un grupo de nodos, verifica que estés programando VM en un grupo de nodos, no en un nodo específico o mediante una etiqueta de afinidad.

      • Verifica que el nombre del nodo especificado coincida con el nombre de un nodo en la zona.

      • Comprueba que el nombre del grupo de nodos especificado coincida con el nombre de un grupo de nodos en la zona.

      • No puedes programar una VM de usuario único si la plataforma de CPU mínima (--min-cpu-platform) de la VM está configurada como un valor diferente de AUTOMATIC.

Usuarios de VM

Ajuste de escala automático de grupos de nodos

  • Problema: No se puede habilitar el escalador automático del grupo de nodos.

    • Solución: Solo puedes habilitar el escalador automático del grupo de nodos cuando estableces la política de mantenimiento del grupo de nodos en la política de mantenimiento Predeterminada.
  • Problema: Deseas retener nodos ya reservados con la política de mantenimiento de migración dentro del grupo de nodos.

    • Solución: Cuando uses la política de mantenimiento de migración dentro del grupo de nodos, configura el escalador automático del grupo de nodos para que solo escale horizontalmente, lo que agrega nodos al grupo de nodos cuando necesita capacidad adicional.
  • Problema: No hay cuota de CPU restante en la región.

    • Solución: El ajuste de escala automático puede fallar si no tienes cuota de CPU restante en la región, la cantidad de nodos de un grupo es la cantidad máxima permitida o hay un problema de facturación. Según el error, es posible que debas solicitar un aumento en la cuota de CPU o crear un nuevo grupo de nodos de usuario único.

Licencias adquiridas por el usuario (BYOL)

  • Problema: Configuración de la política de mantenimiento de reinicio en su ubicación.

    • Solución: Si se usa la política de mantenimiento de reinicio en su ubicación, configura la OnHostMaintenanceSetting de la VM como terminate.
  • Problema: Programación de VM en grupos de nodos con la política de mantenimiento de migración dentro del grupo de nodos.

    • Solución:

      • Programa las VM en un grupo de nodos, no en un nodo específico o mediante una etiqueta de afinidad personalizada.

      • Crea 2 nodos y habilita el escalador automático. De lo contrario, si creas un grupo de nodos de tamaño 1, el nodo se reserva para retención.

Problemas de capacidad

  • Problema: No hay capacidad suficiente en un nodo o en un grupo de nodos.

    • Solución:

      • Si vuelves a programar una VM en un nodo que programa VM en paralelo, hay casos poco frecuentes en los que podría no haber capacidad suficiente.

      • Si vuelves a programar una VM en un nodo de un grupo de nodos en el que todavía no habilitaste el ajuste de escala automático, es posible que no haya capacidad.

      • Si vuelves a programar una VM en un nodo de un grupo de nodos en el que habilitaste el ajuste de escala automático, pero superaste tu cuota de CPU, es posible que no haya capacidad.

Exceso de compromiso de CPU

  • Problema: Hay un error que indica que no se especificó ningún grupo de nodos de usuario único cuando se configuró el valor para la cantidad mínima de CPU:

    Invalid value for field 'resource.scheduling.minNodeCpus': '2'. Node virtual
    CPU count may only be specified for sole-tenant instances.
    
    • Solución: Especifica un grupo de nodos de usuario único cuando configures el valor para la cantidad mínima de CPU.
  • Problema: Hay un error que indica que la cantidad total de CPU para todas las VM de usuario único en un nodo es mayor que la capacidad de CPU del tipo de nodo.

    Node virtual CPU count must not be greater than the guest virtual CPU count.
    
    No feasible nodes found for the instance given its node affinities and other
    constraints.
    
    • Solución: Especifica los valores de la cantidad mínima de CPU en cada VM de modo que el total para todas las VM no supere la cantidad de CPU especificada por el tipo de nodo de usuario único.
  • Problema: Hay un error que indica que la cantidad total de CPU especificada por los tipos de máquina en todas las VM de un nodo es más del doble de la cantidad mínima de CPU especificada para todas las VM en un nodo.

    Guest virtual CPU count must not be greater than [~2.0] times the node
    virtual CPU count.
    
    • Solución: Aumenta el valor de la cantidad mínima de CPU para las VM en este nodo hasta que la cantidad mínima total de CPU sea mayor o igual que la mitad de la cantidad total de CPU determinadas por los tipos de máquina.
  • Problema: Hay un error que indica que el valor para la cantidad mínima de CPU no es un número par mayor o igual que 2.

    Invalid value for field 'resource.scheduling.minNodeCpus': '3'. Node virtual
    CPU count must be even.
    
    • Solución: Especifica un valor para la cantidad mínima de CPU que sea un número par mayor o igual que 2.

GPU

  • Problema: Hay un error que indica que la creación de la instancia falló debido a una incompatibilidad de propiedades de nodo.

    Instance could not be scheduled due to no matching node with property compatibility.
    
    • Solución: Los nodos de usuario único habilitados para GPU solo admiten VMs que tienen GPUs conectadas. Para resolver este problema, aprovisiona una VM de usuario único con GPUs.

¿Qué sigue?