Dalam implementasi Google Distributed Cloud, VM bidang kontrol untuk admin memiliki dua disk yang terpasang:
Boot disk memiliki sistem operasi untuk VM.
{i>Disk<i} data memiliki kredensial dan {i>database<i} etcd, yang menyimpan status cluster admin. Artinya, disk data menyimpan semua objek Kubernetes untuk cluster admin.
Halaman ini menunjukkan cara melakukan pemulihan saat VM bidang kontrol hilang atau saat booting {i>disk<i} disusupi. Contoh:
- Boot disk menjadi hanya-baca karena log jurnal spam.
- Sistem file overlay Docker rusak.
Halaman ini tidak membahas pemulihan disk data. Untuk petunjuk tentang cara memulihkan {i>disk<i} data, melihat Memulihkan cluster admin.
Memperbaiki VM bidang kontrol
Langkah-langkah yang Anda lakukan untuk memperbaiki VM bidang kontrol cluster admin berbeda sedikit bergantung pada apakah Anda memiliki cluster admin dengan ketersediaan tinggi (HA) atau cluster admin non-HA.
HA
Cluster admin HA memiliki tiga VM bidang kontrol. Anda harus memiliki minimal dua VM untuk memunculkan bidang kontrol cluster. Jika tiga VM gagal, perbaiki VM yang gagal satu per satu. Setelah VM kedua diperbaiki dan dijalankan, bidang kontrol cluster akan muncul kembali.
Jalankan perintah berikut:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ganti kode berikut:
ADMIN_CLUSTER_CONFIG
dengan jalur cluster admin Anda file konfigurasi Anda.ADMIN_CLUSTER_KUBECONFIG
dengan jalur cluster admin Anda {i>kubeconfig<i}.
Output perintah ini akan mirip dengan berikut ini:
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:
Masukkan nomor untuk VM yang ingin Anda perbaiki. Jika Anda tidak melihat VM di output, hubungi Dukungan Google Cloud.
Jika Anda memiliki tiga VM yang perlu diperbaiki,
gkectl repair admin-master
akan menampilkan pesan error yang mirip dengan setelah memperbaiki VM pertama:If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.
Dalam hal ini, jalankan kembali perintah untuk memperbaiki VM kedua.
Non-HA
Jalankan perintah berikut:
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ganti kode berikut:
ADMIN_CLUSTER_CONFIG
dengan jalur cluster admin Anda file konfigurasi Anda.ADMIN_CLUSTER_KUBECONFIG
dengan jalur cluster admin Anda Filekubeconfig
.
VM bidang kontrol di cluster admin di-clone ke dalam template VM, yang memiliki
semua informasi yang diperlukan untuk
membuat ulang VM. gkectl repair admin-master
menggunakan template VM untuk membuat VM baru. Lalu, alat ini memasangkan
boot disk dan {i>data disk<i} yang sudah ada.
Jika node cluster Anda mendapatkan alamatnya dari server DHCP, VM baru mungkin memiliki alamat IP yang berbeda dari VM asli.
Langkah selanjutnya
- Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.