Riparazione della VM del piano di controllo del cluster di amministrazione

In un'implementazione di Google Distributed Cloud, la VM del piano di controllo cluster di amministrazione ha due dischi collegati:

  • Il disco di avvio include il sistema operativo per la VM.

  • Il disco dati contiene le credenziali e il database etcd, in cui è archiviato lo stato il cluster di amministrazione. Ciò significa che il disco dati archivia tutti gli oggetti Kubernetes per il cluster di amministrazione.

Questa pagina mostra come recuperare quando la VM del piano di controllo viene persa o si avvia se il disco è compromesso. Ad esempio:

  • Il disco di avvio diventa di sola lettura a causa dei log del journal dello spam.
  • Il file system dell'overlay di Docker si danneggia.

Questa pagina non riguarda il ripristino del disco dati. Per istruzioni su come ripristinare il disco dati, Ripristinare un cluster di amministrazione.

Ripara la VM del piano di controllo

I passaggi da eseguire per riparare la VM del piano di controllo del cluster di amministrazione sono diversi leggermente a seconda che tu abbia o meno un cluster di amministrazione ad alta disponibilità o un cluster di amministrazione non ad alta disponibilità.

HA

Un cluster di amministrazione ad alta disponibilità ha tre VM del piano di controllo. Devi avere almeno due VM per visualizzare il piano di controllo del cluster. Se si verifica un errore di tre VM, ripara le VM in errore, una alla volta. Dopo che la seconda VM è stata riparata ed in esecuzione, deve rieseguire il piano di controllo del cluster.

  1. Esegui questo comando:

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Sostituisci quanto segue:

    • ADMIN_CLUSTER_CONFIG con il percorso del cluster di amministrazione di configurazione del deployment.

    • ADMIN_CLUSTER_KUBECONFIG con il percorso del cluster di amministrazione kubeconfig.

    L'output del comando è simile al seguente:

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Inserisci il numero della VM che vuoi riparare. Se non vedi la VM nell'output, contatta l'assistenza Google Cloud.

    Se hai tre VM da riparare, gkectl repair admin-master restituisce un messaggio di errore simile alla dopo la riparazione della prima VM:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    In questo caso, esegui nuovamente il comando per riparare la seconda VM.

Non ad alta disponibilità

Esegui questo comando:

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Sostituisci quanto segue:

  • ADMIN_CLUSTER_CONFIG con il percorso del cluster di amministrazione di configurazione del deployment.
  • ADMIN_CLUSTER_KUBECONFIG con il percorso del cluster di amministrazione kubeconfig file.

La VM del piano di controllo del cluster di amministrazione viene clonata in un modello di VM, che è tutte le informazioni necessarie per ricreare la VM. gkectl repair admin-master utilizza il modello di VM per creare una nuova VM. Quindi allega una nuova di avvio e del disco dati esistente.

Se i nodi del cluster ricevono gli indirizzi da un server DHCP, la nuova VM potrebbe un indirizzo IP diverso da quello della VM originale.

Passaggi successivi