Mematikan satu bilah

Halaman ini menjelaskan cara mematikan dan memulai ulang salah satu blade perlengkapan air-gapped Google Distributed Cloud (GDC), misalnya untuk memindahkan perangkat guna mempertahankan blade.

Sebelum memulai

Pastikan Anda menghentikan semua workload sebelum melanjutkan. Google tidak dapat menjamin apa yang akan terjadi jika beban kerja aktif selama penonaktifan.

Jika Anda ingin mematikan semua bilah, ikuti Mematikan perangkat. Saat mengikuti petunjuk ini, nonaktifkan hanya satu blade dan biarkan appliance air gap Google Distributed Cloud (GDC) tetap berjalan dengan dua blade aktif.

Prasyarat

  1. Anda dapat menjalankan runbook ini di laptop atau workstation yang terhubung ke jaringan appliance air-gapped Google Distributed Cloud (GDC). Atau, Anda dapat menghubungkan laptop atau workstation ke tombol dengan mengikuti langkah-langkah di Menghubungkan perangkat.
  2. Pastikan Anda memiliki akses ke Kubeconfig untuk cluster root-admin.
  3. Tetapkan variabel lingkungan KUBECONFIG yang benar dengan menjalankan export KUBECONFIG=<path to kubeconfig>.

Mematikan blade

  1. Dapatkan informasi node dengan menjalankan kubectl get nodes -A. Tentukan NODE_NAME blade yang akan dimatikan.

  2. Jeda sinkronisasi BareMetalHost dengan menjalankan perintah berikut agar blade dimatikan:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=true" --overwrite
    

    Contoh output perintah ini adalah:

    baremetalhost.metal3.io/**-**-bm** annotated
    
  3. Pisahkan node target:

    kubectl cordon NODE_NAME
    

    Contoh outputnya adalah:

    node/**-**-bm** cordoned
    
  4. Pindahkan node target:

    kubectl drain NODE_NAME --delete-emptydir-data --grace-period 900 --ignore-daemonsets --disable-eviction
    

    Contoh output:

    node/**-**-bm** already cordoned
    WARNING: ignoring DaemonSet-managed Pods: kube-system/anetd-krj2z, kube-system/etcd-defrag-xh469, kube-system/ipam-controller-manager-2f4dz, kube-system/istio-cni-node-cgqv4, kube-system/kube-proxy-5mwf2, kube-system/localpv-mn2jh, kube-system/metallb-speaker-6l7sv, mon-system/mon-node-exporter-backend-nd8mp, netapp-trident/netapp-trident-node-linux-rrlmd, obs-system/anthos-audit-logs-forwarder-tpfqv, obs-system/anthos-log-forwarder-npjh4, obs-system/kube-control-plane-metrics-proxy-wp8nh, obs-system/log-failure-detector-crbnv, obs-system/oplogs-forwarder-sqwvj, vm-system/macvtap-v9pgp, vm-system/virt-handler-86khx
    pod/grafana-0 deleted
    pod/capi-kubeadm-bootstrap-controller-manager-1.30.400-gke.136lvgtf deleted
    pod/grafana-0 deleted
    pod/grafana-proxy-server-86d8fc4758-mkc4f deleted
    .
    .
    .
    
  5. Hentikan node target dengan tuntas:

  6. Nonaktifkan NODE_NAME menggunakan iLO:

    • Ambil kredensial untuk mengakses iLO:

      1. Mendapatkan nama pengguna:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.username}" | base64 --decode
        
      2. Mendapatkan sandi:

        kubectl get secret bmc-credentials-NODE_NAME -n gpc-system -o jsonpath="{.data.password}" | base64 --decode
        
      3. Ambil alamat BMC-IP untuk NODE_NAME dari nilai di kolom BMC-IP:

        kubectl get servers -A
        
    • Buka alamat BMC-IP yang diperoleh pada langkah sebelumnya dan login dengan memasukkan nama pengguna dan sandi yang diperoleh.

    • Arahkan kursor ke tombol pertama di baris atas. Seharusnya menampilkan Power: ON. Klik lab-report-service tersebut. Menu drop-down akan muncul, klik item pertama berlabel Momentary Press. Warna tombol akan berubah dari Hijau menjadi Oranye, yang berarti node sedang dimatikan. Tunggu hingga tombol berubah warna menjadi kuning, yang menunjukkan bahwa mesin telah dimatikan. Proses ini akan memakan waktu beberapa menit.

  7. Tunggu 30 menit hingga rekonsiliasi selesai.

Mulai ulang blade

Bagian ini menjelaskan langkah-langkah untuk melakukan booting blade yang dimatikan sebelumnya.

Prasyarat

Anda dapat menjalankan runbook ini di laptop atau workstation yang terhubung ke jaringan appliance air-gapped Google Distributed Cloud (GDC). Atau, Anda dapat menghubungkan laptop atau workstation ke tombol dengan mengikuti langkah-langkah di Menghubungkan perangkat. Pastikan Anda memiliki akses ke Kubeconfig untuk cluster root-admin. Tetapkan variabel lingkungan KUBECONFIG yang benar dengan menjalankan export KUBECONFIG=<path to kubeconfig>.

Rencana tindakan

  1. Tekan tombol daya pada pisau. Setelah blade diaktifkan, tunggu beberapa menit hingga bidang kontrol terhubung. kubectl harus dapat terhubung ke bidang kontrol dalam waktu kurang dari 30 menit.

  2. Tentukan nama node target dengan menjalankan kubectl get nodes -A.

  3. Jadwalkan node target agar penjadwalan dapat dilakukan:

    kubectl uncordon `NODE_NAME`
    
  4. Lanjutkan sinkronisasi BareMetalHost untuk node target:

    kubectl annotate bmhost -n gpc-system NODE_NAME "baremetalhost.metal3.io/paused=false" --overwrite
    
  5. Tunggu 30 menit hingga rekonsiliasi selesai.