In einer Google Distributed Cloud-Implementierung hat die Steuerungsebenen-VM für einen Administratorcluster zwei angehängte Laufwerke:
Das Bootlaufwerk hat das Betriebssystem für die VM.
Das Datenlaufwerk hat Anmeldedaten und die etcd-Datenbank, die den Status des Administratorclusters speichert. Das heißt, auf dem Datenlaufwerk werden alle Kubernetes-Objekte für den Administratorcluster gespeichert.
Auf dieser Seite wird gezeigt, wie Sie eine Wiederherstellung durchführen können, wenn die VM der Steuerungsebene verloren geht oder das Bootlaufwerk manipuliert wird. Beispiel:
- Das Bootlaufwerk wird aufgrund von Spam-Journallogs schreibgeschützt.
- Das Dateisystem des Docker-Overlays wird beschädigt.
Die Wiederherstellung des Datenlaufwerks wird auf dieser Seite nicht behandelt. Eine Anleitung zum Wiederherstellen des Datenlaufwerks finden Sie unter Administratorcluster wiederherstellen.
VM der Steuerungsebene reparieren
Die Schritte zum Reparieren der VM der Steuerungsebene des Administratorclusters unterscheiden sich geringfügig, je nachdem, ob Sie einen Administratorcluster mit Hochverfügbarkeit (HA) oder einen nicht hochverfügbaren Administratorcluster haben.
HA
Ein HA-Administratorcluster hat drei VMs der Steuerungsebene. Sie benötigen mindestens zwei VMs, um die Cluster-Steuerungsebene zu starten. Wenn drei VMs ausgefallen sind, reparieren Sie sie einzeln. Nachdem die zweite VM repariert und wieder ausgeführt wird, sollte die Clustersteuerungsebene wieder verfügbar sein.
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIG
durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.ADMIN_CLUSTER_KUBECONFIG
durch den Pfad der kubeconfig-Datei Ihres Administratorclusters.
Die Ausgabe dieses Befehls sieht in etwa so aus:
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:
Geben Sie die Nummer der VM ein, die Sie reparieren möchten. Wenn die VM nicht in der Ausgabe angezeigt wird, Google Cloud wenden Sie sich an den Support.
Wenn Sie drei VMs reparieren müssen, gibt
gkectl repair admin-master
nach der Reparatur der ersten VM eine Fehlermeldung ähnlich der folgenden aus:If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.
Führen Sie in diesem Fall den Befehl noch einmal aus, um die zweite VM zu reparieren.
Ohne Hochverfügbarkeit
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIG
durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.- Ersetzen Sie
ADMIN_CLUSTER_KUBECONFIG
durch den Pfad derkubeconfig
-Datei Ihres Administratorclusters.
Die VM der Steuerungsebene des Administratorclusters wird in eine VM-Vorlage geklont, die über alle Informationen verfügt, die zum erneuten Erstellen der VM erforderlich sind. Der Befehl gkectl repair admin-master
verwendet die VM-Vorlage zum Erstellen einer neuen VM. Dann werden ein neues Bootlaufwerk und das vorhandene Datenlaufwerk angehängt.
Wenn Ihre Clusterknoten ihre Adressen von einem DHCP-Server beziehen, hat die neue VM möglicherweise eine andere IP-Adresse als die ursprüngliche VM.
Nächste Schritte
- Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.