Diese Seite richtet sich an Infrastrukturbetreiber.
Wenn ein Knoten ausfällt, wird das zugehörige NodePool
-Objekt nicht aktualisiert. Da der ausgefallene Knoten weiterhin als Teil des Clusters gilt, melden das Objekt AdminOperator
und der Beobachtbarkeitsstack möglicherweise einen fehlerhaften Status. Wenn Sie einen fehlerhaften Knoten für die Reparatur oder Ersetzung entfernen möchten, können Sie das Entfernen aus dem Cluster erzwingen.
So entfernen Sie einen fehlerhaften Knoten:
Bearbeiten Sie zum Entfernen des Eintrags für den ausgefallenen Knoten das Objekt
Cluster
für den Administratorcluster:- Bearbeiten Sie die Datei
admin.yaml
, um den Eintrag für den unerwünschten Knoten aus dessen übergeordnetem ElementNodePool
zu entfernen. Führen Sie den folgenden Befehl aus, um den Cluster zu aktualisieren:
actl clusters baremetal update cluster admin --kubeconfig actl-workspace/admin/admin-kubeconfig
- Bearbeiten Sie die Datei
Führen Sie den folgenden Befehl aus, um zu prüfen, ob 1 Knoten weniger für den aktualisierten Knotenpool vorhanden ist:
kubectl get nodepools -A
Der entfernte Knoten wird möglicherweise weiterhin angezeigt, wenn Sie den folgenden Befehl ausführen:
kubectl get nodes -o wide
Führen Sie zum Entfernen des
Node
-Objekts den folgenden Befehl aus, um den entsprechenden fehlerhaften Computer mit der Annotationbaremetal.cluster.gke.io/force-remove
zu versehen. Der Wert der Annotation selbst spielt keine Rolle:kubectl --kubeconfig ADMIN_KUBECONFIG -n CLUSTER_NAMESPACE \ annotate machine 10.200.0.8 baremetal.cluster.gke.io/force-remove=true
Nachdem der Controller den Abgleich der Änderungen abgeschlossen hat, ist das Objekt
Node
nicht mehr sichtbar. Das ObjektAdminOperator
und der Beobachtbarkeitsstack melden jetzt einen fehlerfreien Zustand.