Fehlerhafte Knoten aus Anthos entfernen, das im nicht verbundenen Modus ausgeführt wird

Diese Seite richtet sich an Infrastrukturbetreiber.

Wenn ein Knoten ausfällt, wird das zugehörige NodePool-Objekt nicht aktualisiert. Da der ausgefallene Knoten weiterhin als Teil des Clusters gilt, melden das Objekt AdminOperator und der Beobachtbarkeitsstack möglicherweise einen fehlerhaften Status. Wenn Sie einen fehlerhaften Knoten für die Reparatur oder Ersetzung entfernen möchten, können Sie das Entfernen aus dem Cluster erzwingen.

So entfernen Sie einen fehlerhaften Knoten:

  1. Bearbeiten Sie zum Entfernen des Eintrags für den ausgefallenen Knoten das Objekt Cluster für den Administratorcluster:

    1. Bearbeiten Sie die Datei admin.yaml, um den Eintrag für den unerwünschten Knoten aus dessen übergeordnetem Element NodePool zu entfernen.
    2. Führen Sie den folgenden Befehl aus, um den Cluster zu aktualisieren:

      actl clusters baremetal update cluster admin --kubeconfig actl-workspace/admin/admin-kubeconfig
      
  2. Führen Sie den folgenden Befehl aus, um zu prüfen, ob 1 Knoten weniger für den aktualisierten Knotenpool vorhanden ist:

    kubectl get nodepools -A
    

    Der entfernte Knoten wird möglicherweise weiterhin angezeigt, wenn Sie den folgenden Befehl ausführen:

    kubectl get nodes -o wide
    
  3. Führen Sie zum Entfernen des Node-Objekts den folgenden Befehl aus, um den entsprechenden fehlerhaften Computer mit der Annotation baremetal.cluster.gke.io/force-remove zu versehen. Der Wert der Annotation selbst spielt keine Rolle:

    kubectl --kubeconfig ADMIN_KUBECONFIG -n CLUSTER_NAMESPACE \
      annotate machine 10.200.0.8 baremetal.cluster.gke.io/force-remove=true
    
  4. Nachdem der Controller den Abgleich der Änderungen abgeschlossen hat, ist das Objekt Node nicht mehr sichtbar. Das Objekt AdminOperator und der Beobachtbarkeitsstack melden jetzt einen fehlerfreien Zustand.