Forcer la suppression des nœuds endommagés dans les clusters Anthos sur Bare Metal

Parfois, pour supprimer un nœud défectueux à des fins de réparation ou de remplacement, vous devrez peut-être forcer sa suppression du cluster. La suppression forcée ne supprime que le nœud défectueux du point de vue de la gestion des clusters. La suppression forcée contourne les tâches de nettoyage pour les composants installés sur le nœud lui-même Lors de la récupération du nœud, exécutez bmctl reset nodes pour nettoyer les composants installés sur le nœud afin de pouvoir le réutiliser.

Forcer la suppression des nœuds

Les méthodes suivantes s'appliquent aux nœuds du plan de contrôle et aux nœuds de calcul. Pour les nœuds du plan de contrôle, les contrôleurs des clusters Anthos sur solution Bare Metal assurent également la tenue des registres des adhésions etcd.

Utiliser un fichier de cookie (bmctl)

Vous pouvez utiliser bmctl pour supprimer le nœud du cluster. Normalement, bmctl reset déclenche une tâche de réinitialisation pour essayer de nettoyer les composants installés sur le nœud. Pour supprimer le nœud du cluster sans être bloqué lors du nettoyage des packages installés, vous pouvez exécuter la commande bmctl avec l'option --force:

bmctl reset nodes --addresses NODE_IP --force --kubeconfig ADMIN_KUBECONFIG --cluster CLUSTER_NAME

Remplacez les éléments suivants :

  • NODE_IP: adresse IP du nœud à réinitialiser, telle que 10.200.0.8.

  • ADMIN_KUBECONFIG : chemin d'accès au fichier kubeconfig du cluster d'administrateur.

  • CLUSTER_NAME: nom du cluster cible contenant les nœuds

Utiliser un fichier de cookie (kubectl)

Dans les clusters Anthos sur Bare Metal, vous pouvez ajouter une annotation pour marquer un nœud en vue de la suppression forcée.

Après avoir supprimé le nœud du pool de nœuds parent, exécutez la commande suivante pour annoter la machine défaillante correspondante avec l'annotation baremetal.cluster.gke.io/force-remove. La valeur de l'annotation elle-même n'a pas d'importance.

kubectl --kubeconfig ADMIN_KUBECONFIG -n CLUSTER_NAMESPACE \
  annotate machine 10.200.0.8 baremetal.cluster.gke.io/force-remove=true

Les clusters Anthos sur Bare Metal suppriment le nœud avec succès.