Clusterprobleme diagnostizieren

Die Funktion „Systemstatus prüfen“ überwacht regelmäßig den Zustand der Clustersteuerungsebene und mehrerer kritischer Komponenten. So können Sie potenzielle Probleme mit Ihren Clustern erkennen und diagnostizieren.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

Probleme festgestellt

Die Cluster-Systemdiagnose erkennt die folgenden Probleme in einem Cluster und benachrichtigt Sie darüber:

  • kube-scheduler-Zustand auf Steuerungsebenenknoten: Wenn der kube-scheduler-Zustand „nicht gesund“ ist, gibt es im Cluster Probleme beim Zuweisen von Pods zu Knoten. Weitere Informationen finden Sie im kube-scheduler-Pod-Log.

  • kube-controller-manager-Status auf Knoten der Steuerungsebene: kube-controller-manager überwacht verschiedene Controller, z. B. ReplicaSet-, Bereitstellungs- und Namespace-Controller. Wenn der kube-controller-manager als nicht gesund eingestuft wird, funktioniert mindestens einer der von ihm verwalteten Controller möglicherweise nicht richtig. Um das genaue Problem zu ermitteln, können Sie das kube-controller-manager-Pod-Protokoll prüfen. Es enthält möglicherweise weitere Informationen zu den nicht funktionierenden Controllern.

  • Kapazität des Stammvolumes: Die Systemdiagnose prüft, ob das Stammvolume jedes Knotens der Steuerungsebene ausreichend Kapazität hat. Wenn die verfügbare Kapazität unter 512 MB fällt, werden Sie von der Systemdiagnose auf das potenzielle Risiko hingewiesen, dass der Speicherplatz bald aufgebraucht ist.

Systemdiagnoseereignisse ansehen

Führen Sie den folgenden Befehl aus, um Benachrichtigungen von der Systemdiagnose für einen bestimmten Cluster aufzurufen:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Ersetzen Sie Folgendes:

  • CLUSTER_NAME: der Name des Clusters
  • GOOGLE_CLOUD_LOCATION: der Name des Google Cloud Standorts, der den Cluster verwaltet.

Hier ein Auszug aus der zu erwartenden Ausgabe:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

In diesem Beispiel gibt die Fehlermeldung an, dass eine kube-controller-manager-Komponente nicht betriebsbereit ist und dass die Kapazität des Stammvolumes eines Knotens der Steuerungsebene niedrig wird.

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.