Memperbaiki VM bidang kontrol cluster admin

Dalam implementasi GKE di VMware, VM bidang kontrol untuk cluster admin memiliki dua disk yang terpasang:

  • Boot disk memiliki sistem operasi untuk VM.

  • Disk data memiliki kredensial dan database etcd, yang menyimpan status cluster admin. Artinya, disk data menyimpan semua objek Kubernetes untuk cluster admin.

Halaman ini menunjukkan cara memulihkan saat VM control-plane hilang atau boot disk disusupi. Contoh:

  • Boot disk menjadi hanya-baca karena log jurnal spam.
  • Sistem file overlay Docker rusak.

Halaman ini tidak membahas pemulihan disk data. Untuk mengetahui petunjuk cara memulihkan disk data, lihat Memulihkan cluster admin.

Memperbaiki VM bidang kontrol

Langkah-langkah yang Anda lakukan untuk memperbaiki VM bidang kontrol cluster admin sedikit berbeda bergantung pada apakah Anda memiliki cluster admin dengan ketersediaan tinggi (HA) atau cluster admin non-HA.

Non-HA

Jalankan perintah berikut:

gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Ganti:

  • ADMIN_CLUSTER_CONFIG dengan jalur file konfigurasi cluster admin Anda.

  • ADMIN_CLUSTER_KUBECONFIG dengan jalur file kubeconfig cluster admin Anda.

Ketersediaan tinggi (HA)

Cluster admin dengan ketersediaan tinggi (HA) memiliki 3 VM bidang kontrol. Anda harus memiliki minimal dua VM untuk memunculkan bidang kontrol cluster. Jika tiga VM gagal, perbaiki VM yang gagal satu per satu. Setelah VM kedua diperbaiki dan dijalankan, bidang kontrol cluster akan kembali aktif.

  1. Jalankan perintah berikut:

    gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Ganti:

    • ADMIN_CLUSTER_CONFIG dengan jalur file konfigurasi cluster admin Anda.

    • ADMIN_CLUSTER_KUBECONFIG dengan jalur file kubeconfig cluster admin Anda.

    Output perintah ini akan mirip dengan berikut ini:

    Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM.
    [1] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:51.815518 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk
    
    [2] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.228252 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk
    
    [3] VM template:         /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl
        GKE on-prem version: 1.16.0-gke.550
        Creation time:       2023-07-25 01:52:54.210705 +0000 UTC
        CPU:                 4 CPU(s)
        Memory:              16384 MB
        Data disk:           [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk
    
    Please enter your numeric choice:
    
  2. Masukkan nomor VM yang ingin diperbaiki. Jika Anda tidak melihat VM di output, hubungi Dukungan Google Cloud.

    Jika Anda memiliki tiga VM yang perlu diperbaiki, gkectl repair admin-master akan menampilkan pesan error yang mirip dengan berikut ini setelah memperbaiki VM pertama:

    If you are repairing admin control plane VM for HA admin cluster,
    it's possible that the API server is still down after repairing one
    of the VMs. Try continue fixing other control plane VMs listed to
    recover the quorum of control plane.
    

    Dalam hal ini, jalankan kembali perintah untuk memperbaiki VM kedua.

Notes

VM bidang kontrol cluster admin di-clone ke dalam template VM, yang memiliki semua informasi yang diperlukan untuk membuat ulang VM. Perintah gkectl repair admin-master menggunakan template VM untuk membuat VM baru. Kemudian boot disk baru dipasang dan disk data yang sudah ada.

Jika node cluster Anda mendapatkan alamatnya dari server DHCP, VM baru mungkin memiliki alamat IP yang berbeda dari VM asli.