VM der Steuerungsebene des Administratorclusters reparieren

In einer GKE on VMware-Implementierung sind an die VM der Steuerungsebene für einen Administratorcluster zwei Laufwerke angehängt:

  • Das Bootlaufwerk hat das Betriebssystem für die VM.

  • Das Datenlaufwerk hat Anmeldedaten und die etcd-Datenbank, die den Status des Administratorclusters speichert. Das heißt, auf dem Datenlaufwerk werden alle Kubernetes-Objekte für den Administratorcluster gespeichert.

Auf dieser Seite wird beschrieben, wie Sie eine Wiederherstellung durchführen, wenn die VM der Steuerungsebene verloren geht oder das Bootlaufwerk manipuliert wurde. Beispiel:

  • Das Bootlaufwerk wird aufgrund von Spam-Journallogs schreibgeschützt.
  • Das Dateisystem des Docker-Overlays wird beschädigt.

Die Wiederherstellung des Datenlaufwerks wird auf dieser Seite nicht behandelt. Eine Anleitung zum Wiederherstellen des Datenlaufwerks finden Sie unter Administratorcluster wiederherstellen.

VM der Steuerungsebene reparieren

Die Schritte zum Reparieren der VM des Administratorclusters unterscheiden sich geringfügig, je nachdem, ob Sie einen Administratorcluster mit Hochverfügbarkeit oder einen Administratorcluster ohne Hochverfügbarkeit haben.

Hochverfügbarkeit

Ein Hochverfügbarkeits-Administratorcluster hat drei VMs der Steuerungsebene. Sie benötigen mindestens zwei VMs, um die Steuerungsebene des Clusters aufzurufen. Wenn drei VMs ausgefallen sind, reparieren Sie die fehlgeschlagenen VMs nacheinander. Nachdem die zweite VM repariert und ausgeführt wurde, sollte die Clustersteuerungsebene wieder aktiviert werden.

  1. Führen Sie dazu diesen Befehl aus:

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Ersetzen Sie Folgendes:

    • ADMIN_CLUSTER_CONFIG durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.

    • ADMIN_CLUSTER_KUBECONFIG durch den Pfad der kubeconfig-Datei Ihres Administratorclusters.

    Die Ausgabe dieses Befehls sieht in etwa so aus:

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Geben Sie die Nummer der VM ein, die Sie reparieren möchten. Wenn die VM nicht in der Ausgabe angezeigt wird, wenden Sie sich an den Google Cloud-Support.

    Wenn drei VMs repariert werden müssen, gibt gkectl repair admin-master nach der Reparatur der ersten VM eine Fehlermeldung wie die folgende aus:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    Führen Sie in diesem Fall den Befehl noch einmal aus, um die zweite VM zu reparieren.

Ohne Hochverfügbarkeit

Führen Sie dazu diesen Befehl aus:

gkectl repair admin-master \
  --config ADMIN_CLUSTER_CONFIG \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Ersetzen Sie Folgendes:

  • ADMIN_CLUSTER_CONFIG durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.
  • ADMIN_CLUSTER_KUBECONFIG durch den Pfad der Datei kubeconfig Ihres Administratorclusters.

Die VM der Steuerungsebene des Administratorclusters wird in eine VM-Vorlage geklont, die über alle Informationen verfügt, die zum erneuten Erstellen der VM erforderlich sind. Der Befehl gkectl repair admin-master verwendet die VM-Vorlage zum Erstellen einer neuen VM. Dann werden ein neues Bootlaufwerk und das vorhandene Datenlaufwerk angehängt.

Wenn Ihre Clusterknoten ihre Adressen von einem DHCP-Server beziehen, hat die neue VM möglicherweise eine andere IP-Adresse als die ursprüngliche VM.

Nächste Schritte