Reparar la máquina virtual de plano de control del clúster del administrador

En una implementación de Google Distributed Cloud, la VM del plano de control de un clúster de administrador tiene dos discos conectados:

  • El disco de arranque tiene el sistema operativo de la VM.

  • El disco de datos tiene credenciales y la base de datos etcd, que almacena el estado del clúster de administrador. Es decir, el disco de datos almacena todos los objetos de Kubernetes del clúster de administrador.

En esta página se explica cómo realizar una recuperación cuando se pierde la VM del plano de control o se pone en peligro el disco de arranque. Por ejemplo:

  • El disco de arranque pasa a ser de solo lectura debido a los registros del diario de spam.
  • El sistema de archivos superpuesto de Docker se daña.

En esta página no se explica cómo recuperar el disco de datos. Para obtener instrucciones sobre cómo recuperar el disco de datos, consulta Restaurar un clúster de administrador.

Reparar la VM del plano de control

Los pasos que debes seguir para reparar la máquina virtual de plano de control del clúster de administrador varían ligeramente en función de si tienes un clúster de administrador de alta disponibilidad (HA) o no.

HA

Un clúster de administrador de alta disponibilidad tiene tres VMs de plano de control. Debes tener al menos dos VMs para activar el plano de control del clúster. Si se han producido errores en tres VMs, repáralas una a una. Una vez que la segunda VM se haya reparado y esté en funcionamiento, el plano de control del clúster debería volver a estar activo.

  1. Ejecuta el siguiente comando:

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Haz los cambios siguientes:

    • ADMIN_CLUSTER_CONFIG con la ruta del archivo de configuración de tu clúster de administrador.

    • ADMIN_CLUSTER_KUBECONFIG con la ruta del archivo kubeconfig de tu clúster de administrador.

    El resultado del comando es similar al siguiente:

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Introduce el número de la máquina virtual que quieras reparar. Si no ves la máquina virtual en el resultado, ponte en contacto con el Google Cloud equipo de Asistencia.

    Si tienes tres VMs que necesitan reparación, gkectl repair admin-master muestra un mensaje de error similar al siguiente después de reparar la primera VM:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    En ese caso, vuelve a ejecutar el comando para reparar la segunda VM.

Sin alta disponibilidad

Ejecuta el siguiente comando:

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Haz los cambios siguientes:

  • ADMIN_CLUSTER_CONFIG con la ruta del archivo de configuración de tu clúster de administrador.
  • ADMIN_CLUSTER_KUBECONFIG con la ruta del archivo kubeconfig de tu clúster de administrador.

La VM de plano de control del clúster del administrador se clona en una plantilla de VM, que contiene toda la información necesaria para volver a crear la VM. El comando gkectl repair admin-master usa la plantilla de VM para crear una VM. A continuación, adjunta un nuevo disco de arranque y el disco de datos que ya tenías.

Si los nodos de tu clúster obtienen sus direcciones de un servidor DHCP, es posible que la nueva VM tenga una dirección IP diferente a la de la VM original.

Siguientes pasos