Fehlerbehebung bei Arm-Arbeitslasten


Auf dieser Seite wird beschrieben, wie Sie Probleme mit Arm-Arbeitslasten beheben, die auf Ihren Autopilot- oder Standard-Clustern in Google Kubernetes Engine (GKE) bereitgestellt werden.

Pods auf Arm-Knoten stürzen ab

Das folgende Problem tritt auf, wenn Sie einen Pod auf einem Arm-Knoten bereitstellen, das Container-Image jedoch nicht für die Arm-Architektur erstellt wird.

So erkennen Sie das Problem:

  1. Rufen Sie den Status der Pods ab:

    kubectl get pods
    
  2. Rufen Sie die Logs für einen abstürzenden Pod ab:

    kubectl logs POD_NAME
    

    Ersetzen Sie POD_NAME durch den Namen des abstürzenden Pods.

    Die Fehlermeldung in Ihren Pod-Logs sieht in etwa so aus:

    exec ./hello-app: exec format error
    

Achten Sie zur Behebung dieses Problems darauf, dass Ihr Container-Image die Arm-Architektur unterstützt. Als Best Practice sollten Sie mehrere Architektur-Images erstellen.

Pod löst keine Hochskalierung aus

Gilt für: Autopilot

Das folgende Problem tritt in Autopilot-Clustern auf, wenn Sie versuchen, Arm-Arbeitslasten in nicht unterstützten GKE-Versionen oder nicht unterstützten Google Cloud-Regionen bereitzustellen.

Rufen Sie zur Identifizierung des Problems Ihr Clusterereignis-Log auf:

kubectl get events -w

Die Ausgabe sieht etwa so aus:

117s        Normal    NotTriggerScaleUp   pod/hello-app2-78fc858558-pg4hz   pod didn't trigger scale-up (it wouldn't fit if a new node is added): 2 node(s) didn't match Pod's node affinity/selector

Vergewissern Sie sich zur Lösung dieses Problems, dass auf Ihrem Autopilot-Cluster die GKE-Version 1.24.1-gke.1400 oder höher ausgeführt wird und die Google Cloud-Region Arm-Knoten unterstützt.

Pods bleiben im Status "Ausstehend"

Gilt für: Autopilot

Das folgende Problem tritt auf, wenn Sie versuchen, Autopilot-Pods in Arm-Architektur bereitzustellen, aber Ihr Kontingent für Ihr Google Cloud-Projekt erschöpft ist.

Rufen Sie zum Identifizieren des Problems das Ereignislog für Ihren Cluster ab:

kubectl get events -w

Die Ausgabe sieht etwa so aus:

29m         Warning   FailedScaleUp       pod/hello-app-7b86c88cb8-8vt2k   Node scale up in zones asia-southeast1-b associated with this pod failed: GCE quota exceeded. Pod is at risk of not being scheduled.

Dieses Ereignis wird möglicherweise nicht sofort in Ihrem Log angezeigt, wenn Sie Ihre Pods bereitstellen.

Versuchen Sie, eine Kontingenterhöhung anzufordern, um dieses Problem zu beheben.