Ein Blade herunterfahren

Auf dieser Seite wird beschrieben, wie Sie ein beliebiges Blade der Air-Gap-Appliance von Google Distributed Cloud (GDC) herunterfahren und neu starten, z. B. um das Gerät zu verschieben, um ein Blade zu warten.

Hinweise

Stoppen Sie alle Arbeitslasten, bevor Sie fortfahren. Google kann nicht garantieren, was passiert, wenn Arbeitslasten während des Herunterfahrens aktiv sind.

Wenn Sie alle Blades herunterfahren möchten, folgen Sie der Anleitung unter Gerät herunterfahren. Wenn Sie dieser Anleitung folgen, fahren Sie nur ein Blade herunter und lassen Sie die Google Distributed Cloud (GDC) Air-Gap-Appliance mit zwei aktiven Blades laufen.

Vorbereitung

  1. Sie können dieses Runbook auf einem Laptop oder einer Workstation ausführen, die mit dem Netzwerk der Air-Gap-Appliance von Google Distributed Cloud (GDC) verbunden ist. Alternativ können Sie einen Laptop oder eine Workstation mit dem Switch verbinden. Folgen Sie dazu der Anleitung unter Gerät verbinden.
  2. Sie benötigen Zugriff auf die Kubeconfig für den Root-Administratorcluster.
  3. Legen Sie die richtige KUBECONFIG-Umgebungsvariable fest, indem Sie export KUBECONFIG=<path to kubeconfig> ausführen.

Blade herunterfahren

  1. Rufen Sie die Knoteninformationen mit dem Befehl kubectl get nodes -A ab. Bestimme die NODE_NAME des Messers, die geschlossen werden soll.

  2. Pausieren Sie die BareMetalHost-Synchronisierung, indem Sie den folgenden Befehl für das herunterzufahrende Blade ausführen:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=true" --overwrite
    

    Hier ein Beispiel für die Ausgabe dieses Befehls:

    baremetalhost.metal3.io/**-**-bm** annotated
    
  3. Sperren Sie den Zielknoten:

    kubectl cordon NODE_NAME
    

    Beispielausgabe:

    node/**-**-bm** cordoned
    
  4. Leeren Sie den Zielknoten:

    kubectl drain NODE_NAME --delete-emptydir-data --grace-period 900 --ignore-daemonsets --disable-eviction
    

    Beispielausgabe:

    node/**-**-bm** already cordoned
    WARNING: ignoring DaemonSet-managed Pods: kube-system/anetd-krj2z, kube-system/etcd-defrag-xh469, kube-system/ipam-controller-manager-2f4dz, kube-system/istio-cni-node-cgqv4, kube-system/kube-proxy-5mwf2, kube-system/localpv-mn2jh, kube-system/metallb-speaker-6l7sv, mon-system/mon-node-exporter-backend-nd8mp, netapp-trident/netapp-trident-node-linux-rrlmd, obs-system/anthos-audit-logs-forwarder-tpfqv, obs-system/anthos-log-forwarder-npjh4, obs-system/kube-control-plane-metrics-proxy-wp8nh, obs-system/log-failure-detector-crbnv, obs-system/oplogs-forwarder-sqwvj, vm-system/macvtap-v9pgp, vm-system/virt-handler-86khx
    pod/grafana-0 deleted
    pod/capi-kubeadm-bootstrap-controller-manager-1.30.400-gke.136lvgtf deleted
    pod/grafana-0 deleted
    pod/grafana-proxy-server-86d8fc4758-mkc4f deleted
    .
    .
    .
    
  5. Fahren Sie den Zielknoten ordnungsgemäß herunter:

  6. So deaktivieren Sie NODE_NAME über iLO:

    • Rufen Sie die Anmeldedaten für den Zugriff auf iLO ab:

      1. Rufen Sie den Nutzernamen ab:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.username}" | base64 --decode
        
      2. So rufen Sie das Passwort ab:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.password}" | base64 --decode
        
      3. Rufen Sie die BMC-IP-Adresse für NODE_NAME anhand der Werte in der Spalte BMC-IP ab:

        kubectl get servers -A
        
    • Rufen Sie die im vorherigen Schritt erhaltene BMC-IP-Adresse auf und melden Sie sich mit dem erhaltenen Nutzernamen und Passwort an.

    • Bewegen Sie den Mauszeiger auf die erste Schaltfläche in der oberen Zeile. Es sollte Power: ON angezeigt werden. Klicken Sie darauf. Ein Drop-down-Menü wird angezeigt. Klicken Sie auf den ersten Eintrag mit der Bezeichnung Momentary Press. Die Farbe der Schaltfläche ändert sich von Grün zu Orange. Das bedeutet, dass der Knoten heruntergefahren wird. Warte, bis die Taste gelb leuchtet. Das kann einige Minuten dauern.

  7. Warten Sie 30 Minuten, bis die Abstimmung abgeschlossen ist.

Blade neu starten

In diesem Abschnitt wird beschrieben, wie Sie ein Blade starten, das zuvor heruntergefahren wurde.

Vorbereitung

Sie können dieses Runbook auf einem Laptop oder einer Workstation ausführen, die mit dem Netzwerk der Air-Gap-Appliance von Google Distributed Cloud (GDC) verbunden ist. Alternativ können Sie einen Laptop oder eine Workstation mit dem Switch verbinden. Folgen Sie dazu der Anleitung unter Gerät verbinden. Sie benötigen Zugriff auf die Kubeconfig für den Root-Administratorcluster. Legen Sie die richtige KUBECONFIG-Umgebungsvariable mit dem Befehl export KUBECONFIG=<path to kubeconfig> fest.

Maßnahmenplan

  1. Drücken Sie die Ein/Aus-Taste am Tracker. Warten Sie nach dem Hochfahren des Blade einige Minuten, bis die Steuerungsebene verbunden ist. kubectl sollte innerhalb von 30 Minuten eine Verbindung zur Steuerungsebene herstellen können.

  2. Ermitteln Sie den Namen des Zielknotens, indem Sie kubectl get nodes -A ausführen.

  3. Heben Sie die Sperrung des Zielknotens auf, um die Planung zu aktivieren:

    kubectl uncordon `NODE_NAME`
    
  4. Synchronisierung von „BareMetalHost“ für den Zielknoten fortsetzen:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=false" --overwrite
    
  5. Warten Sie 30 Minuten, bis die Abstimmung abgeschlossen ist.