Repare a VM do plano de controlo do cluster de administrador

Numa implementação do Google Distributed Cloud, a VM do plano de controlo para um cluster de administrador tem dois discos anexados:

  • O disco de arranque tem o sistema operativo para a VM.

  • O disco de dados tem credenciais e a base de dados etcd, que armazena o estado do cluster de administrador. Ou seja, o disco de dados armazena todos os objetos do Kubernetes para o cluster de administrador.

Esta página mostra como fazer a recuperação quando a VM do plano de controlo é perdida ou o disco de arranque é comprometido. Por exemplo:

  • O disco de arranque torna-se só de leitura devido aos registos do diário de spam.
  • O sistema de ficheiros de sobreposição do Docker fica danificado.

Esta página não aborda a recuperação do disco de dados. Para ver instruções sobre como recuperar o disco de dados, consulte o artigo Restaurar um cluster de administrador.

Repare a VM do plano de controlo

Os passos que executa para reparar a VM do plano de controlo do cluster de administrador diferem ligeiramente consoante tenha um cluster de administrador de alta disponibilidade (HA) ou um cluster de administrador sem HA.

HA

Um cluster de administrador de HA tem 3 VMs do plano de controlo. Tem de ter, pelo menos, duas VMs para ativar o plano de controlo do cluster. Se três VMs falharem, repare as VMs com falhas uma de cada vez. Após a reparação e a execução da segunda VM, o plano de controlo do cluster deve ser reposto.

  1. Execute o seguinte comando:

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Substitua o seguinte:

    • ADMIN_CLUSTER_CONFIG com o caminho do ficheiro de configuração do cluster de administrador.

    • ADMIN_CLUSTER_KUBECONFIG com o caminho do ficheiro kubeconfig do cluster de administrador.

    O resultado do comando é semelhante ao seguinte:

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Introduza o número da VM que quer reparar. Se não vir a VM no resultado, contacte o Google Cloud apoio técnico.

    Se tiver três VMs que precisam de ser reparadas, o gkectl repair admin-master produz uma mensagem de erro semelhante à seguinte após reparar a primeira VM:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    Neste caso, execute novamente o comando para reparar a segunda VM.

Não HA

Execute o seguinte comando:

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Substitua o seguinte:

  • ADMIN_CLUSTER_CONFIG com o caminho do ficheiro de configuração do cluster de administrador.
  • ADMIN_CLUSTER_KUBECONFIG com o caminho do ficheiro kubeconfig do cluster de administrador.

A VM do plano de controlo do cluster de administrador é clonada num modelo de VM, que tem todas as informações necessárias para recriar a VM. O comando gkectl repair admin-master usa o modelo de VM para criar uma nova VM. Em seguida, anexa um novo disco de arranque e o disco de dados existente.

Se os nós do cluster obtiverem os respetivos endereços a partir de um servidor DHCP, a nova VM pode ter um endereço IP diferente da VM original.

O que se segue?