Questa pagina è rivolta agli operatori di infrastruttura.
Quando un nodo non è disponibile, l'oggetto NodePool
associato non viene aggiornato. Poiché il nodo non funzionante è ancora considerato parte del cluster, l'oggetto AdminOperator
e lo stack di osservabilità potrebbero segnalare uno stato non integro. Per rimuovere un nodo danneggiato per riparazioni o sostituzione, puoi forzarne la rimozione dal cluster.
Per rimuovere un nodo non funzionante, segui questi passaggi:
Per rimuovere la voce per il nodo scaricato, modifica l'oggetto
Cluster
per il cluster di amministrazione:- Modifica il file
admin.yaml
per rimuovere la voce per il nodo indesiderato dalla relativaNodePool
principale. Esegui il comando seguente per aggiornare il cluster:
actl clusters baremetal update cluster admin --kubeconfig actl-workspace/admin/admin-kubeconfig
- Modifica il file
Per verificare che esista un nodo in meno per il pool di nodi aggiornato, esegui il comando seguente:
kubectl get nodepools -A
Il nodo rimosso potrebbe continuare a essere mostrato quando viene eseguito il seguente comando:
kubectl get nodes -o wide
Per rimuovere l'oggetto
Node
, esegui il comando seguente per annotare la macchina che non funziona con l'annotazionebaremetal.cluster.gke.io/force-remove
. Il valore dell'annotazione stessa non è rilevante:kubectl --kubeconfig ADMIN_KUBECONFIG -n CLUSTER_NAMESPACE \ annotate machine 10.200.0.8 baremetal.cluster.gke.io/force-remove=true
Dopo che il controller avrà completato la riconciliazione delle modifiche, l'oggetto
Node
non sarà più visibile. L'oggettoAdminOperator
e lo stack di osservabilità segnalano ora uno stato integro.