Halaman ini menjelaskan cara men-debug masalah node di Google Distributed Cloud (khusus software) untuk VMware menggunakan serangkaian alat debug yang telah diinstal sebelumnya.
Ringkasan
Setiap cluster Google Distributed Cloud yang Anda buat terdiri dari beberapa
node. Setiap node mencakup distribusi
toolbox
CoreOS, skrip
shell yang mengekstrak dan menjalankan container proses debug, debug-toolbox
.
debug-toolbox
adalah image container yang mencakup beberapa alat debug yang berguna.
Jika Anda mengalami masalah dengan node tertentu, Anda dapat mencoba melakukan proses debug dengan
menghubungkan ke node yang terpengaruh, menjalankan skrip toolbox
untuk mengekstrak dan menjalankan
penampung debug-toolbox
, serta menjalankan alat yang disertakan dalam penampung.
Alat yang disertakan dalam container debug-toolbox
Container debug-toolbox
menjalankan image dasar Debian yang mencakup paket berikut:
- bash
- curl
- dnsutils
- hping3
- iperf3
- lsof
- netcat
- mtr
- procps
- strace
- tcpdump
- traceroute
- util-linux
Karena disertakan dalam container, alat ini tidak memerlukan koneksi internet. Jika ingin menginstal alat debug tambahan, Anda menggunakan
apt-get
, yang memerlukan koneksi internet.
Menggunakan toolbox
Jalankan perintah
toolbox
:sudo toolbox
Perintah ini memulai container
debug-toolbox
.Saat berada di dalam container, jalankan salah satu alat. Contoh,
tcpdump
.Setelah selesai, keluar dari container dan tutup koneksi SSH ke node.
Node Problem Detector
Node Problem Detector, yang diaktifkan untuk semua node dalam cluster, membantu mendeteksi dengan cepat beberapa masalah node umum. Node Problem Detector terus memeriksa kemungkinan masalah dan melaporkannya sebagai peristiwa dan kondisi pada node. Jika node berperilaku tidak semestinya, Anda dapat memeriksa apakah Node Problem Detector mendeteksi masalah tersebut dengan menjalankan kubectl describe
di node dan mencari peristiwa dan kondisi yang sesuai.
Monitor Node Problem Detector menghasilkan beberapa kondisi pada node. Jika
kondisi yang dilaporkan adalah KubeletUnhealthy
atau ContainerRuntimeUnhealthy
, mulai ulang layanan systemd
yang sesuai (kubelet atau Docker) dapat membantu
memulihkan status node.
Mulai dari Google Distributed Cloud versi 1.5, perbaikan otomatis layanan systemd kubelet dan docker diaktifkan di Node Problem Detector. Jika
Node Problem Detector mendeteksi kondisi KubeletUnhealthy
atau
ContainerRuntimeUnhealthy
pada node, Node Problem Detector akan mencoba memulai ulang layanan kubelet atau docker secara otomatis jika durasi sejak dimulai ulang terakhir kali berada di atas nilai minimum tertentu.
Langkah berikutnya
Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.
Anda juga dapat melihat bagian Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang sumber dukungan, termasuk yang berikut:
- Persyaratan untuk membuka kasus dukungan.
- Alat untuk membantu Anda memecahkan masalah, seperti log dan metrik.
- Komponen yang didukung, versi, dan fitur Google Distributed Cloud untuk VMware (khusus software).