Men-debug masalah node

Halaman ini menjelaskan cara men-debug masalah node pada GKE di VMware menggunakan serangkaian alat proses debug prainstal.

Ringkasan

Setiap GKE di cluster VMware yang Anda buat terdiri dari beberapa node. Setiap node menyertakan distribusi toolbox CoreOS, skrip shell yang mengekstrak dan menjalankan container proses debug, debug-toolbox. debug-toolbox adalah image container yang menyertakan beberapa tools proses debug yang berguna.

Jika mengalami masalah dengan node tertentu, Anda dapat mencoba melakukan proses debug dengan menghubungkan ke node yang terpengaruh, menjalankan skrip toolbox untuk mengekstrak dan menjalankan penampung debug-toolbox, serta menjalankan alat yang disertakan dalam penampung.

Alat yang disertakan dalam penampung debug-toolbox

Penampung debug-toolbox menjalankan image dasar Debian yang menyertakan paket berikut:

  • bash
  • curl
  • {i>dnsutils<i}
  • hping3
  • iperf3
  • Lsof
  • Netcat
  • mtr
  • procps
  • warna strace
  • tcpdump
  • traceroute
  • util-linux

Karena disertakan dalam container, alat tersebut tidak memerlukan koneksi internet. Jika ingin menginstal alat proses debug tambahan, gunakan apt-get, yang memerlukan koneksi internet.

Menggunakan toolbox

  1. SSH ke node cluster.

  2. Jalankan perintah toolbox:

    sudo toolbox

    Perintah ini memulai container debug-toolbox.

  3. Saat berada di dalam container, jalankan salah satu tools. Misalnya, tcpdump.

  4. Setelah selesai, keluar dari container dan tutup koneksi SSH ke node.

Pendeteksi Masalah Node

Mulai dari GKE pada VMware versi 1.4, Node Problem Detector, yang diaktifkan untuk semua node dalam cluster, membantu deteksi cepat untuk beberapa masalah node umum. Pendeteksi Masalah Node terus memeriksa kemungkinan masalah dan melaporkan hal yang sama dengan peristiwa dan kondisi pada node. Jika node tidak berfungsi, Anda dapat memeriksa apakah Pendeteksi Masalah Node mendeteksi masalah dengan menjalankan kubectl describe pada node tersebut dan mencari peristiwa dan kondisi yang sesuai.

Monitor Detektor Masalah Node menghasilkan beberapa kondisi pada node. Jika kondisi yang dilaporkan adalah KubeletUnhealthy atau ContainerRuntimeUnhealthy, memulai ulang layanan systemd yang sesuai (kubelet atau Docker) mungkin dapat membantu membuat node menjadi sehat kembali.

Mulai dari GKE di VMware versi 1.5, perbaikan otomatis layanan sistem kubelet dan docker diaktifkan di Node Problem Detector. Jika Node Problem Detector mendeteksi kondisi KubeletUnhealthy atau ContainerRuntimeUnhealthy pada node, node Problem Detector akan mencoba memulai ulang layanan kubelet atau docker secara otomatis jika durasi sejak mulai ulang terakhir berada di atas batas tertentu.