In un'implementazione di GKE su VMware, la VM del piano di controllo per un cluster di amministrazione ha due dischi collegati:
Il disco di avvio include il sistema operativo della VM.
Il disco dati contiene credenziali e il database etcd, in cui è archiviato lo stato del cluster di amministrazione. In altre parole, il disco dati archivia tutti gli oggetti Kubernetes per il cluster di amministrazione.
Questa pagina mostra come eseguire il ripristino quando la VM del piano di controllo viene persa o il disco di avvio viene compromesso. Ad esempio:
- Il disco di avvio diventa di sola lettura a causa dei log del journal dello spam.
- Il file system di overlay Docker si danneggia.
Questa pagina non riguarda il ripristino del disco dati. Per istruzioni su come recuperare il disco dati, vedi Ripristinare un cluster di amministrazione.
Ripara la VM del piano di controllo
I passaggi da eseguire per riparare la VM del piano di controllo del cluster di amministrazione variano leggermente a seconda che tu disponga di un cluster di amministrazione ad alta disponibilità o di un cluster di amministrazione non ad alta disponibilità.
AH
Un cluster di amministrazione ad alta disponibilità ha tre VM del piano di controllo. Devi avere almeno due VM per attivare il piano di controllo del cluster. Se sono presenti tre VM in errore, riparale una alla volta. Dopo aver riparato ed in esecuzione la seconda VM, il piano di controllo del cluster dovrebbe tornare.
Esegui questo comando:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Sostituisci quanto segue:
ADMIN_CLUSTER_CONFIG
con il percorso del file di configurazione del cluster di amministrazione.ADMIN_CLUSTER_KUBECONFIG
con il percorso del file kubeconfig del tuo cluster di amministrazione.
L'output del comando è simile al seguente:
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:
Inserisci il numero della VM da riparare. Se non vedi la VM nell'output, contatta l'assistenza Google Cloud.
Se disponi di tre VM da riparare, dopo aver riparato la prima VM,
gkectl repair admin-master
restituisce un messaggio di errore simile al seguente:If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.
In questo caso, esegui nuovamente il comando per riparare la seconda VM.
Senza alta disponibilità
Esegui questo comando:
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Sostituisci quanto segue:
ADMIN_CLUSTER_CONFIG
con il percorso del file di configurazione del cluster di amministrazione.ADMIN_CLUSTER_KUBECONFIG
con il percorso del filekubeconfig
del tuo cluster di amministrazione.
La VM del piano di controllo del cluster di amministrazione viene clonata in un modello di VM che contiene tutte le informazioni necessarie per ricreare la VM. Il comando gkectl repair admin-master
utilizza il modello di VM per creare una nuova VM. Quindi collega un nuovo disco di avvio
e il disco dati esistente.
Se i nodi del cluster ricevono gli indirizzi da un server DHCP, la nuova VM potrebbe avere un indirizzo IP diverso da quello della VM originale.
Passaggi successivi
- Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.