Soluciona problemas de cargas de trabajo de Arm


En esta página, se muestra cómo resolver problemas con cargas de trabajo de Arm implementadas en tus clústeres de Google Kubernetes Engine (GKE) Autopilot o Standard.

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.

Los Pods en nodos Arm fallan

El siguiente problema ocurre cuando implementas un Pod en un nodo Arm, pero la imagen de contenedor no está compilada para la arquitectura Arm.

Para identificar el problema, haz lo siguiente:

  1. Obtén el estado de los Pods:

    kubectl get pods
    
  2. Obtén los registros de un Pod que falla:

    kubectl logs POD_NAME
    

    Reemplaza POD_NAME con el nombre del Pod que falla.

    El mensaje de error en los registros de tu Pod es similar al siguiente:

    exec ./hello-app: exec format error
    

Para resolver este problema, asegúrate de que la imagen de contenedor sea compatible con la arquitectura de Arm. Como práctica recomendada, compila varias imágenes de arquitectura.

El Pod no activa el escalamiento vertical

Se aplica a: Autopilot

El siguiente problema ocurre en los clústeres de Autopilot cuando intentas implementar cargas de trabajo de Arm en versiones de GKE no compatibles o en regiones de Google Cloud no compatibles.

Para identificar el problema, obtén tu registro de eventos del clúster:

kubectl get events -w

El resultado es similar a este:

117s        Normal    NotTriggerScaleUp   pod/hello-app2-78fc858558-pg4hz   pod didn't trigger scale-up (it wouldn't fit if a new node is added): 2 node(s) didn't match Pod's node affinity/selector

Para resolver este problema, asegúrate de que tu clúster de Autopilot ejecute la versión 1.24.1-gke.1400 de GKE o una posterior y que la región de Google Cloud admita nodos Arm.

Pods atascados en el estado Pendiente

Se aplica a: Autopilot

El siguiente problema ocurre cuando intentas implementar Pods de Autopilot en la arquitectura de Arm, pero tu proyecto de Google Cloud superó la cuota.

Para identificar el problema, obtén el registro de eventos de tu clúster:

kubectl get events -w

El resultado es similar a este:

29m         Warning   FailedScaleUp       pod/hello-app-7b86c88cb8-8vt2k   Node scale up in zones asia-southeast1-b associated with this pod failed: GCE quota exceeded. Pod is at risk of not being scheduled.

Es posible que este evento no aparezca en tu registro apenas implementes tus Pods.

Para resolver este problema, intenta solicitar un aumento de cuota.

¿Qué sigue?

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.