Questa pagina è stata tradotta dall'API Cloud Translation.

Riparazione della VM del piano di controllo del cluster di amministrazione

In un'implementazione di Google Distributed Cloud, la VM del control plane per un cluster di amministrazione ha due dischi collegati:

Il disco di avvio contiene il sistema operativo per la VM.
Il disco di dati contiene le credenziali e il database etcd, che memorizza lo stato del cluster di amministrazione. ovvero il disco di dati archivia tutti gli oggetti Kubernetes per il cluster di amministrazione.

Questa pagina mostra come eseguire il ripristino quando la VM del control plane viene persa o il disco di avvio è compromesso. Ad esempio:

Il disco di avvio diventa di sola lettura a causa dei log del journal di spam.
Il file system di overlay Docker viene danneggiato.

Questa pagina non tratta il recupero del disco di dati. Per istruzioni su come recuperare il disco di dati, vedi Ripristino di un cluster di amministrazione.

Ripara la VM del control plane

I passaggi da eseguire per riparare la VM del control plane del cluster di amministrazione variano leggermente a seconda che tu disponga di un cluster di amministrazione ad alta disponibilità (HA) o di un cluster di amministrazione non HA.

HA

Un cluster di amministrazione HA ha tre VM del control plane. Devi avere almeno due VM per avviare il control plane del cluster. Se tre VM non funzionano, ripara le VM con errori una alla volta. Dopo che la seconda VM è stata riparata e in esecuzione, il control plane del cluster dovrebbe riattivarsi.

Esegui questo comando:

gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Sostituisci quanto segue:

ADMIN_CLUSTER_CONFIG con il percorso del file di configurazione del cluster di amministrazione.
ADMIN_CLUSTER_KUBECONFIG con il percorso del file kubeconfig del cluster di amministrazione.

L'output di questo comando è simile al seguente:

Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
[1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
    GKE on-prem version: 1.16.0-gke.550
    Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
    CPU:                 4 CPU(s)
    Memory:              16384 MB
    Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk

[2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
    GKE on-prem version: 1.16.0-gke.550
    Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
    CPU:                 4 CPU(s)
    Memory:              16384 MB
    Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk

[3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
    GKE on-prem version: 1.16.0-gke.550
    Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
    CPU:                 4 CPU(s)
    Memory:              16384 MB
    Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk

Please enter your numeric choice:

Inserisci il numero della VM da riparare. Se non vedi la VM nell'output, contatta Google Cloud l'assistenza.

Se hai tre VM da riparare, gkectl repair admin-master restituisce un messaggio di errore simile al seguente dopo aver riparato la prima VM:
```
If you are repairing admin control plane VM for HA admin cluster,
it's possible that the API server is still down after repairing one
of the VMs. Try continue fixing other control plane VMs listed to
recover the quorum of control plane.
```
In questo caso, esegui di nuovo il comando per riparare la seconda VM.

Non HA

Esegui questo comando:

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Sostituisci quanto segue:

ADMIN_CLUSTER_CONFIG con il percorso del file di configurazione del cluster di amministrazione.
ADMIN_CLUSTER_KUBECONFIG con il percorso del file kubeconfig del cluster di amministrazione.

La VM del control plane del cluster di amministrazione viene clonata in un modello di VM, che contiene tutte le informazioni necessarie per ricreare la VM. Il comando gkectl repair admin-master utilizza il modello VM per creare una nuova VM. Poi collega un nuovo disco di avvio e il disco di dati esistente.

Se i nodi del cluster ricevono gli indirizzi da un server DHCP, la nuova VM potrebbe avere un indirizzo IP diverso da quello della VM originale.

Passaggi successivi

Se hai bisogno di ulteriore assistenza, contatta l'assistenza clienti Google Cloud.
Puoi anche consultare la sezione Richiedere assistenza per ulteriori informazioni sulle risorse di assistenza, tra cui:
- Requisiti per l'apertura di una richiesta di assistenza.
- Strumenti per aiutarti a risolvere i problemi, come log e metriche.
- Componenti supportati, versioni e funzionalità di Google Distributed Cloud per VMware (solo software).