In einer Google Distributed Cloud-Implementierung hat die VM der Steuerungsebene für einen Administratorcluster zwei angehängte Laufwerke:
Das Bootlaufwerk hat das Betriebssystem für die VM.
Das Datenlaufwerk hat Anmeldedaten und die etcd-Datenbank, die den Status des Administratorclusters speichert. Das heißt, auf dem Datenlaufwerk werden alle Kubernetes-Objekte für den Administratorcluster gespeichert.
Auf dieser Seite wird beschrieben, wie Sie eine Wiederherstellung durchführen, wenn die VM der Steuerungsebene verloren geht oder das Bootlaufwerk manipuliert wurde. Beispiel:
- Das Bootlaufwerk wird aufgrund von Spam-Journallogs schreibgeschützt.
- Das Dateisystem des Docker-Overlays wird beschädigt.
Die Wiederherstellung des Datenlaufwerks wird auf dieser Seite nicht behandelt. Eine Anleitung zum Wiederherstellen des Datenlaufwerks finden Sie unter Administratorcluster wiederherstellen.
VM der Steuerungsebene reparieren
Die Schritte zum Reparieren der VM der Steuerungsebene des Administratorclusters unterscheiden sich geringfügig, je nachdem, ob Sie einen Administratorcluster mit Hochverfügbarkeit oder einen Administratorcluster ohne Hochverfügbarkeit haben.
HA
Ein Hochverfügbarkeits-Administratorcluster hat drei VMs auf Steuerungsebene. Sie benötigen mindestens zwei VMs, um die Steuerungsebene des Clusters aufzurufen. Wenn drei VMs fehlgeschlagen sind, reparieren Sie die fehlgeschlagenen VMs einzeln nacheinander. Nachdem die zweite VM repariert wurde und ausgeführt wird, sollte die Steuerungsebene des Clusters wieder hochgefahren werden.
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIG
durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.ADMIN_CLUSTER_KUBECONFIG
durch den Pfad der kubeconfig-Datei Ihres Administratorclusters.
Die Ausgabe dieses Befehls sieht in etwa so aus:
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:
Geben Sie die Nummer der VM ein, die Sie reparieren möchten. Wenn die VM in der Ausgabe nicht angezeigt wird, wenden Sie sich an den Google Cloud-Support.
Wenn Sie drei VMs haben, die repariert werden müssen, gibt
gkectl repair admin-master
nach der Reparatur der ersten VM eine Fehlermeldung wie die folgende aus:If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.
Führen Sie in diesem Fall den Befehl noch einmal aus, um die zweite VM zu reparieren.
Nicht Hochverfügbarkeit
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIG
durch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.ADMIN_CLUSTER_KUBECONFIG
durch den Pfad der Dateikubeconfig
Ihres Administratorclusters.
Die VM der Steuerungsebene des Administratorclusters wird in eine VM-Vorlage geklont, die über alle Informationen verfügt, die zum erneuten Erstellen der VM erforderlich sind. Der Befehl gkectl repair admin-master
verwendet die VM-Vorlage zum Erstellen einer neuen VM. Dann werden ein neues Bootlaufwerk und das vorhandene Datenlaufwerk angehängt.
Wenn Ihre Clusterknoten ihre Adressen von einem DHCP-Server beziehen, hat die neue VM möglicherweise eine andere IP-Adresse als die ursprüngliche VM.
Nächste Schritte
- Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.