Men-debug masalah node

Halaman ini menjelaskan cara men-debug masalah node di Google Distributed Cloud (khusus software) untuk VMware menggunakan serangkaian alat debug yang telah diinstal sebelumnya.

Ringkasan

Setiap cluster Google Distributed Cloud yang Anda buat terdiri dari beberapa node. Setiap node mencakup distribusi toolbox CoreOS, skrip shell yang mengekstrak dan menjalankan container proses debug, debug-toolbox. debug-toolbox adalah image container yang mencakup beberapa alat debug yang berguna.

Jika Anda mengalami masalah dengan node tertentu, Anda dapat mencoba melakukan proses debug dengan menghubungkan ke node yang terpengaruh, menjalankan skrip toolbox untuk mengekstrak dan menjalankan penampung debug-toolbox, serta menjalankan alat yang disertakan dalam penampung.

Alat yang disertakan dalam container debug-toolbox

Container debug-toolbox menjalankan image dasar Debian yang mencakup paket berikut:

  • bash
  • curl
  • dnsutils
  • hping3
  • iperf3
  • lsof
  • netcat
  • mtr
  • procps
  • strace
  • tcpdump
  • traceroute
  • util-linux

Karena disertakan dalam container, alat ini tidak memerlukan koneksi internet. Jika ingin menginstal alat debug tambahan, Anda menggunakan apt-get, yang memerlukan koneksi internet.

Menggunakan toolbox

  1. SSH ke node cluster.

  2. Jalankan perintah toolbox:

    sudo toolbox

    Perintah ini memulai container debug-toolbox.

  3. Saat berada di dalam container, jalankan salah satu alat. Contoh, tcpdump.

  4. Setelah selesai, keluar dari container dan tutup koneksi SSH ke node.

Node Problem Detector

Node Problem Detector, yang diaktifkan untuk semua node dalam cluster, membantu mendeteksi dengan cepat beberapa masalah node umum. Node Problem Detector terus memeriksa kemungkinan masalah dan melaporkannya sebagai peristiwa dan kondisi pada node. Jika node berperilaku tidak semestinya, Anda dapat memeriksa apakah Node Problem Detector mendeteksi masalah tersebut dengan menjalankan kubectl describe di node dan mencari peristiwa dan kondisi yang sesuai.

Monitor Node Problem Detector menghasilkan beberapa kondisi pada node. Jika kondisi yang dilaporkan adalah KubeletUnhealthy atau ContainerRuntimeUnhealthy, mulai ulang layanan systemd yang sesuai (kubelet atau Docker) dapat membantu memulihkan status node.

Mulai dari Google Distributed Cloud versi 1.5, perbaikan otomatis layanan systemd kubelet dan docker diaktifkan di Node Problem Detector. Jika Node Problem Detector mendeteksi kondisi KubeletUnhealthy atau ContainerRuntimeUnhealthy pada node, Node Problem Detector akan mencoba memulai ulang layanan kubelet atau docker secara otomatis jika durasi sejak dimulai ulang terakhir kali berada di atas nilai minimum tertentu.

Langkah berikutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Anda juga dapat melihat bagian Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang sumber dukungan, termasuk yang berikut:

  • Persyaratan untuk membuka kasus dukungan.
  • Alat untuk membantu Anda memecahkan masalah, seperti log dan metrik.
  • Komponen yang didukung, versi, dan fitur Google Distributed Cloud untuk VMware (khusus software).