Knoten automatisch reparieren

Auf dieser Seite erfahren Sie, wie Sie die automatische Knotenreparatur in Google Kubernetes Engine (GKE) konfigurieren.

Übersicht

Mit der automatischen Knotenreparatur von GKE können Sie dafür sorgen, dass die Knoten in einem Cluster fehlerfrei ausgeführt werden. Wenn die Funktion aktiviert ist, prüft GKE regelmäßig den Zustand jedes Knotens im Cluster. Wenn ein Knoten über einen längeren Zeitraum mehrere Systemdiagnosen hintereinander nicht besteht, initiiert GKE für diesen Knoten einen Reparaturprozess.

Kriterien für die Reparatur

GKE bestimmt anhand der Statusmeldung eines Knotens, ob dieser repariert werden muss. Ein Knoten mit dem Status Ready wird als fehlerfrei erachtet. GKE veranlasst eine Reparatur, wenn ein Knoten in einer festgelegten Zeit mehrmals hintereinander einen fehlerhaften Status meldet. Ein fehlerhafter Status kann Folgendes bedeuten:

  • Ein Knoten meldet bei aufeinanderfolgenden Prüfungen innerhalb des festgelegten Zeitraums (ungefähr zehn Minuten) den Status NotReady.
  • Ein Knoten meldet innerhalb des festgelegten Zeitraums (ungefähr zehn Minuten) gar keinen Status.
  • Auf dem Bootlaufwerk eines Knotens ist für einen längeren Zeitraum (ungefähr 30 Minuten) kein freier Speicherplatz verfügbar.

Knotenreparatur

Wenn GKE erkennt, dass ein Knoten repariert werden muss, wird der Knoten entleert und neu erstellt. GKE wartet eine Stunde lang, ob der Vorgang abgeschlossen wird. Wenn der Vorgang nicht abgeschlossen wird, wird der Knoten heruntergefahren und ein neuer Knoten erstellt.

Wenn mehrere Knoten eine Reparatur benötigen, kann GKE Knoten parallel reparieren. GKE passt die Anzahl der Reparaturen an die Größe des Clusters und die Anzahl der fehlerhaften Knoten an. Auf einem größeren Cluster repariert GKE mehr Knoten parallel, aber mit zunehmender Anzahl fehlerhafter Knoten werden weniger Knoten gleichzeitig repariert.

Wenn Sie die automatische Knotenreparatur irgendwann während des Reparaturvorgangs deaktivieren, werden laufende Reparaturen nicht abgebrochen, sondern für jeden in Reparatur befindlichen Knoten fortgesetzt.

Verlauf der Knotenreparatur

GKE generiert einen Logeintrag für automatisierte Reparaturereignisse. Mit dem Befehl gcloud container operations list können Sie die Logs prüfen.

Automatische Knotenreparatur aktivieren

Die automatische Knotenreparatur wird für jeden Knotenpool einzeln aktiviert. Wenn Sie einen Cluster erstellen, können Sie die automatische Reparatur für den standardmäßigen Knotenpool des Clusters aktivieren oder deaktivieren. Wenn Sie zusätzliche Knotenpools erstellen, können Sie die automatische Knotenreparatur für diese Knotenpools unabhängig von den Reparatureinstellungen des Standard-Knotenpools aktivieren oder deaktivieren.

Mit dem gcloud-Tool oder der Google Cloud Console können Sie einen Cluster oder Knotenpool mit aktivierter automatischer Knotenreparatur erstellen.

Cluster mit aktivierter automatischer Knotenreparatur erstellen

gcloud

gcloud container clusters create cluster-name --zone compute-zone \
  --enable-autorepair

Console

  1. Rufen Sie in der Cloud Console das Kubernetes Engine-Menü auf.

    Zum Google Kubernetes Engine-Menü

  2. Klicken Sie auf Cluster erstellen.

  3. Konfigurieren Sie den Cluster nach Bedarf.

  4. Klicken Sie im Navigationsbereich unter dem Knotenpool, den Sie ändern möchten, auf Knoten.

  5. Klicken Sie das Kästchen Automatische Reparatur aktivieren an.

  6. Klicken Sie auf Erstellen.

Knotenpool mit aktivierter automatischer Reparatur erstellen

gcloud

gcloud container node-pools create pool-name --cluster cluster-name \
  --zone compute-zone \
  --enable-autorepair

Console

  1. Rufen Sie in der Cloud Console das Kubernetes Engine-Menü auf.

    Zum Google Kubernetes Engine-Menü

  2. Klicken Sie auf die Schaltfläche "Bearbeiten" (Stiftsymbol) des Clusters.

  3. Klicken Sie im Menü Knotenpools auf Knotenpool hinzufügen.

  4. Konfigurieren Sie den Knotenpool wie gewünscht. Klicken Sie dann für den Knotenpool auf Weitere Optionen.

  5. Wählen Sie Automatische Reparatur aktivieren aus.

  6. Klicken Sie auf Speichern, um die Knotenpoolkonfiguration zu speichern.

  7. Klicken Sie noch einmal auf Speichern, um den Cluster zu ändern.

Automatische Reparatur für einen vorhandenen Knotenpool aktivieren

gcloud

gcloud container node-pools update pool-name --cluster cluster-name \
  --zone compute-zone \
  --enable-autorepair

Console

  1. Rufen Sie in der Cloud Console das Kubernetes Engine-Menü auf.

    Zum Google Kubernetes Engine-Menü

  2. Klicken Sie auf die Schaltfläche "Bearbeiten" (Stiftsymbol) des Clusters.

  3. Klicken Sie im Menü Knotenpools für den Knotenpool, den Sie ändern möchten, auf Weitere Optionen.

  4. Wählen Sie Automatische Reparatur aktivieren aus.

  5. Klicken Sie auf Speichern, um die Knotenpoolkonfiguration zu speichern.

  6. Klicken Sie noch einmal auf Speichern, um den Cluster zu ändern.

Automatische Knotenreparatur deaktivieren

Sie können die automatische Knotenreparatur für einen vorhandenen Knotenpool mit dem gcloud-Tool oder der Google Cloud Console deaktivieren.

gcloud

gcloud container node-pools update pool-name --cluster cluster-name \
  --zone compute-zone \
  --no-enable-autorepair

Console

  1. Rufen Sie in der Cloud Console das Kubernetes Engine-Menü auf.

    Zum Google Kubernetes Engine-Menü

  2. Klicken Sie auf die Schaltfläche "Bearbeiten" (Stiftsymbol) des Clusters.

  3. Klicken Sie im Menü Knotenpools für den Knotenpool, den Sie ändern möchten, auf Weitere Optionen.

  4. Heben Sie die Auswahl von Automatische Reparatur aktivieren auf.

  5. Klicken Sie auf Speichern, um die Knotenpoolkonfiguration zu speichern.

  6. Klicken Sie noch einmal auf Speichern, um den Cluster zu ändern.

Weitere Informationen