Réparer la VM de plan de contrôle du cluster d'administrateur

Dans une mise en œuvre Google Distributed Cloud, la VM de plan de contrôle d'un cluster d'administrateur est associée à deux disques :

  • Le disque de démarrage qui contient le système d'exploitation de la VM.

  • Le disque de données qui contient les identifiants et la base de données etcd qui stocke l'état du cluster d'administrateur. En d'autres termes, le disque de données stocke tous les objets Kubernetes pour le cluster administrateur.

Cette page vous montre comment récupérer une VM lorsque la VM du plan de contrôle est perdue ou que le disque de démarrage est compromis. Exemple :

  • Le disque de démarrage passe en lecture seule à cause des journaux de journal spam.
  • Le système de fichiers de superposition Docker est corrompu.

Cette page ne couvre pas la récupération du disque de données. Pour savoir comment récupérer le disque de données, consultez la page Restaurer un cluster d'administrateur.

Réparer la VM de plan de contrôle

Les étapes à suivre pour réparer la VM de plan de contrôle du cluster d'administrateur diffèrent légèrement selon que vous disposez d'un cluster d'administrateur haute disponibilité ou d'un cluster d'administrateur standard.

Haute disponibilité

Un cluster d'administrateur haute disponibilité comporte trois VM de plan de contrôle. Vous devez disposer d'au moins deux VM pour afficher le plan de contrôle du cluster. Si trois VM sont défaillantes, réparez-les une par une. Une fois la deuxième VM réparée et exécutée, le plan de contrôle du cluster doit être rétabli.

  1. Exécutez la commande suivante :

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Remplacez les éléments suivants :

    • ADMIN_CLUSTER_CONFIG par le chemin d'accès de votre fichier de configuration de cluster d'administrateur.

    • ADMIN_CLUSTER_KUBECONFIG par le chemin d'accès au fichier kubeconfig de votre cluster d'administrateur.

    La sortie de la commande ressemble à ceci :

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Saisissez le numéro de la VM que vous souhaitez réparer. Si vous ne voyez pas la VM dans le résultat, contactez l'assistance Google Cloud.

    Si vous avez trois VM à réparer, gkectl repair admin-master génère un message d'erreur semblable au suivant après la réparation de la première VM :

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    Dans ce cas, exécutez à nouveau la commande pour réparer la deuxième VM.

Standard

Exécutez la commande suivante :

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Remplacez les éléments suivants :

  • ADMIN_CLUSTER_CONFIG par le chemin d'accès de votre fichier de configuration de cluster d'administrateur.
  • ADMIN_CLUSTER_KUBECONFIG par le chemin d'accès au fichier kubeconfig de votre cluster d'administrateur.

La VM de plan de contrôle du cluster d'administrateur est clonée dans un modèle de VM qui contient toutes les informations nécessaires à la recréation de la VM. La commande gkectl repair admin-master utilise le modèle de VM pour créer une VM. Elle associe ensuite un nouveau disque de démarrage et le disque de données existant.

Si vos nœuds de cluster obtiennent leurs adresses depuis un serveur DHCP, la nouvelle VM peut avoir une adresse IP différente de la VM d'origine.

Étape suivante