Réparer la VM de plan de contrôle du cluster d'administrateur

Dans une mise en œuvre GKE sur VMware, la VM du plan de contrôle d'un cluster d'administrateur est associée à deux disques:

  • Le disque de démarrage qui contient le système d'exploitation de la VM.

  • Le disque de données qui contient les identifiants et la base de données etcd qui stocke l'état du cluster d'administrateur. Autrement dit, le disque de données stocke tous les objets Kubernetes pour le cluster d'administrateur.

Cette page explique comment effectuer une récupération en cas de perte de la VM du plan de contrôle ou de compromission du disque de démarrage. Exemple :

  • Le disque de démarrage passe en lecture seule à cause des journaux des spams.
  • Le système de fichiers de superposition Docker est corrompu.

Cette page ne couvre pas la récupération du disque de données. Pour savoir comment récupérer le disque de données, consultez la page Restaurer un cluster d'administrateur.

Réparer la VM du plan de contrôle

Les étapes à suivre pour réparer la VM du plan de contrôle du cluster d'administrateur diffèrent légèrement selon que vous disposez d'un cluster d'administrateur haute disponibilité ou d'un cluster d'administrateur standard.

Haute disponibilité

Un cluster d'administrateur à haute disponibilité possède trois VM de plan de contrôle. Vous devez disposer d'au moins deux VM pour afficher le plan de contrôle du cluster. Si trois VM sont défaillantes, réparez-les une par une. Une fois que la deuxième VM est réparée et en cours d'exécution, le plan de contrôle du cluster doit réapparaître.

  1. Exécutez la commande ci-dessous.

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Remplacez les éléments suivants :

    • ADMIN_CLUSTER_CONFIG par le chemin d'accès de votre fichier de configuration de cluster d'administrateur.

    • ADMIN_CLUSTER_KUBECONFIG par le chemin d'accès au fichier kubeconfig de votre cluster d'administrateur.

    La sortie de la commande ressemble à ceci :

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Saisissez le numéro de la VM que vous souhaitez réparer. Si vous ne voyez pas la VM dans le résultat, contactez l'assistance Google Cloud.

    Si trois VM doivent être réparées, gkectl repair admin-master génère un message d'erreur semblable à celui-ci après la réparation de la première VM:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    Dans ce cas, réexécutez la commande pour réparer la deuxième VM.

Non haute disponibilité

Exécutez la commande ci-dessous.

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Remplacez les éléments suivants :

  • ADMIN_CLUSTER_CONFIG par le chemin d'accès de votre fichier de configuration de cluster d'administrateur.
  • ADMIN_CLUSTER_KUBECONFIG par le chemin d'accès au fichier kubeconfig de votre cluster d'administrateur.

La VM de plan de contrôle du cluster d'administrateur est clonée dans un modèle de VM qui contient toutes les informations nécessaires à la recréation de la VM. La commande gkectl repair admin-master utilise le modèle de VM pour créer une VM. Elle associe ensuite un nouveau disque de démarrage et le disque de données existant.

Si vos nœuds de cluster obtiennent leurs adresses depuis un serveur DHCP, la nouvelle VM peut avoir une adresse IP différente de la VM d'origine.

Étapes suivantes