Cierra una cuchilla

En esta página, se describe cómo apagar y reiniciar cualquier blade del dispositivo aislado de Google Distributed Cloud (GDC), por ejemplo, para mover el dispositivo y realizar el mantenimiento de un blade.

Antes de comenzar

Asegúrate de detener todas las cargas de trabajo antes de continuar. Google no puede garantizar lo que sucederá si las cargas de trabajo están activas durante un cierre.

Si quieres apagar todas las cuchillas, sigue los pasos en Cómo apagar el dispositivo. Cuando sigas estas instrucciones, apaga solo una cuchilla y mantén el dispositivo aislado de Google Distributed Cloud (GDC) en funcionamiento con dos cuchillas activas.

Requisitos previos

  1. Puedes ejecutar este manual en una laptop o estación de trabajo conectada a la red del dispositivo aislado de Google Distributed Cloud (GDC). También puedes conectar una laptop o una estación de trabajo al conmutador siguiendo los pasos que se indican en Cómo conectar el dispositivo.
  2. Asegúrate de tener acceso a Kubeconfig para el clúster de administrador raíz.
  3. Ejecuta export KUBECONFIG=<path to kubeconfig> para establecer la variable de entorno KUBECONFIG correcta.

Cierra la cuchilla

  1. Ejecuta kubectl get nodes -A para obtener la información del nodo. Determina el NODE_NAME de la cuchilla para apagarla.

  2. Para pausar la sincronización de BareMetalHost, ejecuta el siguiente comando para que se apague la blade:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=true" --overwrite
    

    El siguiente es un ejemplo del resultado de este comando:

    baremetalhost.metal3.io/**-**-bm** annotated
    
  3. Acordona el nodo de destino:

    kubectl cordon NODE_NAME
    

    El resultado de la muestra es el siguiente:

    node/**-**-bm** cordoned
    
  4. Desvía el nodo de destino:

    kubectl drain NODE_NAME --delete-emptydir-data --grace-period 900 --ignore-daemonsets --disable-eviction
    

    Resultado de muestra:

    node/**-**-bm** already cordoned
    WARNING: ignoring DaemonSet-managed Pods: kube-system/anetd-krj2z, kube-system/etcd-defrag-xh469, kube-system/ipam-controller-manager-2f4dz, kube-system/istio-cni-node-cgqv4, kube-system/kube-proxy-5mwf2, kube-system/localpv-mn2jh, kube-system/metallb-speaker-6l7sv, mon-system/mon-node-exporter-backend-nd8mp, netapp-trident/netapp-trident-node-linux-rrlmd, obs-system/anthos-audit-logs-forwarder-tpfqv, obs-system/anthos-log-forwarder-npjh4, obs-system/kube-control-plane-metrics-proxy-wp8nh, obs-system/log-failure-detector-crbnv, obs-system/oplogs-forwarder-sqwvj, vm-system/macvtap-v9pgp, vm-system/virt-handler-86khx
    pod/grafana-0 deleted
    pod/capi-kubeadm-bootstrap-controller-manager-1.30.400-gke.136lvgtf deleted
    pod/grafana-0 deleted
    pod/grafana-proxy-server-86d8fc4758-mkc4f deleted
    .
    .
    .
    
  5. Cierra el nodo de destino de forma ordenada:

  6. Desactiva NODE_NAME con iLO:

    • Recupera las credenciales para acceder a iLO:

      1. Obtén el nombre de usuario:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.username}" | base64 --decode
        
      2. Obtén la contraseña:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.password}" | base64 --decode
        
      3. Recupera la dirección BMC-IP para NODE_NAME a partir de los valores de la columna BMC-IP:

        kubectl get servers -A
        
    • Visita la dirección BMC-IP que obtuviste en el paso anterior y accede con el nombre de usuario y la contraseña que obtuviste.

    • Coloca el cursor sobre el primer botón de la fila superior. Debería mostrar Power: ON. Haz clic en él. Aparecerá un menú desplegable. Haz clic en el primer elemento etiquetado como Momentary Press. El color del botón cambiará de verde a naranja, lo que significa que el nodo se está apagando. Espera a que el botón cambie de color a amarillo, lo que indica que la máquina se apagó. Esto tardará unos minutos.

  7. Espera 30 minutos para que se complete la conciliación.

Reinicia la blade

En esta sección, se describen los pasos para iniciar una blade que se apagó anteriormente.

Requisitos previos

Puedes ejecutar este manual en una laptop o estación de trabajo conectada a la red del dispositivo aislado de Google Distributed Cloud (GDC). También puedes conectar una laptop o una estación de trabajo al conmutador siguiendo los pasos que se indican en Cómo conectar el dispositivo. Asegúrate de tener acceso a Kubeconfig para el clúster de administrador raíz. Ejecuta export KUBECONFIG=<path to kubeconfig> para establecer la variable de entorno KUBECONFIG correcta.

Plan de acción

  1. Presiona el botón de encendido de la cuchilla. Una vez que la blade esté encendida, espera unos minutos para que se conecte el plano de control. kubectl debería poder conectarse al plano de control en menos de 30 minutos.

  2. Para determinar el nombre del nodo de destino, ejecuta kubectl get nodes -A.

  3. Desacordona el nodo de destino para habilitar la programación:

    kubectl uncordon `NODE_NAME`
    
  4. Reanuda la sincronización de BareMetalHost para el nodo de destino:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=false" --overwrite
    
  5. Espera 30 minutos para que se complete la conciliación.