Halaman ini menjelaskan cara men-debug masalah node pada GKE di VMware menggunakan serangkaian alat proses debug prainstal.
Ringkasan
Setiap GKE di cluster VMware yang Anda buat terdiri dari beberapa
node. Setiap node menyertakan distribusi
toolbox
CoreOS, skrip
shell yang mengekstrak dan menjalankan container proses debug, debug-toolbox
.
debug-toolbox
adalah image container yang menyertakan beberapa tools proses debug
yang berguna.
Jika mengalami masalah dengan node tertentu, Anda dapat mencoba melakukan proses debug dengan
menghubungkan ke node yang terpengaruh, menjalankan skrip toolbox
untuk mengekstrak dan menjalankan
penampung debug-toolbox
, serta menjalankan alat yang disertakan dalam penampung.
Alat yang disertakan dalam penampung debug-toolbox
Penampung debug-toolbox
menjalankan image dasar Debian yang menyertakan
paket berikut:
- bash
- curl
- {i>dnsutils<i}
- hping3
- iperf3
- Lsof
- Netcat
- mtr
- procps
- warna strace
- tcpdump
- traceroute
- util-linux
Karena disertakan dalam container, alat tersebut tidak memerlukan koneksi
internet. Jika ingin menginstal alat proses debug tambahan, gunakan
apt-get
, yang memerlukan koneksi internet.
Menggunakan toolbox
Jalankan perintah
toolbox
:sudo toolbox
Perintah ini memulai container
debug-toolbox
.Saat berada di dalam container, jalankan salah satu tools. Misalnya,
tcpdump
.Setelah selesai, keluar dari container dan tutup koneksi SSH ke node.
Pendeteksi Masalah Node
Mulai dari GKE pada VMware versi 1.4, Node Problem
Detector,
yang diaktifkan untuk semua node dalam cluster, membantu deteksi cepat untuk
beberapa masalah node umum. Pendeteksi Masalah Node terus memeriksa kemungkinan masalah dan melaporkan hal yang sama dengan peristiwa dan kondisi pada node. Jika node tidak berfungsi, Anda dapat memeriksa apakah Pendeteksi Masalah Node mendeteksi masalah dengan menjalankan kubectl describe
pada node tersebut dan mencari peristiwa dan kondisi yang sesuai.
Monitor Detektor Masalah Node menghasilkan beberapa kondisi pada node. Jika kondisi yang dilaporkan adalah KubeletUnhealthy
atau ContainerRuntimeUnhealthy
, memulai ulang layanan systemd
yang sesuai (kubelet atau Docker) mungkin dapat membantu membuat node menjadi sehat kembali.
Mulai dari GKE di VMware versi 1.5, perbaikan otomatis layanan sistem kubelet dan docker diaktifkan di Node Problem Detector. Jika Node Problem Detector mendeteksi kondisi KubeletUnhealthy
atau ContainerRuntimeUnhealthy
pada node, node Problem Detector akan mencoba memulai ulang layanan kubelet atau docker secara otomatis jika durasi sejak mulai ulang terakhir berada di atas batas tertentu.