Memantau kondisi sistem dengan Pendeteksi Masalah Node

Mulai dari Milestone 77, Container-Optimized OS menyertakan agen Node Problem Detector. Anda dapat menggunakan fitur ini untuk memantau kondisi sistem instance COS. Pendeteksi Masalah Node memantau kondisi instance dan melaporkan metrik terkait kondisi ke Cloud Monitoring, termasuk metrik kapasitas dan error yang kemudian dapat Anda visualisasikan dengan dasbor Google Cloud Observability. Metrik yang dikumpulkan dari konfigurasi default tidak dikenai biaya. Google akan menggunakan metrik gabungan untuk memahami masalah node dan meningkatkan keandalan Container-Optimized OS.

Agen telah dikonfigurasi sebelumnya dengan kumpulan metrik yang akan diekspor. Penyesuaian metrik yang dilaporkan untuk agen bawaan saat ini tidak didukung. Node Problem Detector adalah software open source. Anda dapat meninjau kode sumber dan konfigurasi di repositori sumber masing-masing.

Mengaktifkan pemantauan kondisi

Agen Node Problem Detector dinonaktifkan secara default pada waktu booting. Anda dapat mengaktifkan fitur ini menggunakan:

Menggunakan skrip startup

Anda dapat mengaktifkan Pendeteksi Masalah Node menggunakan skrip startup.

Menggunakan cloud-init

Contoh cloud-init menjelaskan dasar-dasar konfigurasi instance Container-Optimized OS. Anda dapat menggunakan cloud-init untuk mengaktifkan pemantauan kondisi dengan contoh cloud-config berikut:

#cloud-config

runcmd:
- systemctl start node-problem-detector

Menggunakan metadata

Di Container-Optimized OS Milestone 88 dan yang lebih baru, Node Problem Detector juga dapat diaktifkan dengan menetapkan nilai google-monitoring-enabled ke true di bagian metadata kustom.

Untuk mengaktifkan pemantauan saat membuat instance:

gcloud compute instances create VM_NAME \
    --image=IMAGE \
    --image-project=cos-cloud \
    --metadata=google-monitoring-enabled=true

Ganti kode berikut:

  • VM_NAME: nama VM baru
  • IMAGE: versi tertentu dari image Container-Optimized OS publik. Contoh, --image=cos-113-18244-85-29.

Untuk mengaktifkan pemantauan di instance yang ada:

gcloud compute instances add-metadata VM_NAME \
    --metadata=google-monitoring-enabled=true

Ganti VM_NAME dengan nama VM.

Mulai milestone 97, pemantauan dapat diaktifkan di metadata project:

gcloud compute project-info add-metadata \
    --metadata google-monitoring-enabled=true

Setelah dieksekusi, layanan node-problem-detector akan diaktifkan.

Menggunakan kebijakan tamu yang ditentukan pengguna

Container-Optimized OS menyertakan agen OS Config, yang menggunakan utilitas sistem OS untuk mempertahankan status VM yang ditentukan dalam kebijakan tamu. Untuk mengetahui detail tentang kebijakan tamu, lihat Mengaktifkan agen OS Config dan Membuat kebijakan tamu. Kebijakan tamu berikut mengaktifkan agen Node problem detector di semua instance.

recipes:
- name: recipe-enable-npd
  desiredState: INSTALLED
  installSteps:
  - scriptRun:
      interpreter: SHELL
      script: |-
        #!/bin/bash
        systemctl start node-problem-detector

Melihat metrik yang dikumpulkan

Pendeteksi Masalah Node melaporkan daftar metrik terhadap resource yang dipantau oleh instance Compute Engine. Metrik didokumentasikan di Daftar metrik pemantauan, dengan awalan compute.googleapis.com/guest/. Anda dapat melihat metrik yang dikumpulkan menggunakan Monitoring Metrics Explorer:

  1. Di konsol Google Cloud, buka Monitoring atau gunakan tombol berikut:

    Buka Monitoring

  2. Di panel navigasi Monitoring, klik Metrics Explorer.

  3. Untuk jenis resource, pilih Instance VM Compute Engine.

  4. Pilih metrik, misalnya "Jumlah Masalah".

  5. Anda akan melihat diagram dan statistik di sisi kanan. Untuk melihat hasil untuk instance Container-Optimized OS tertentu, tetapkan filter ke "instance_id=[INSTANCE_ID]", dengan mengganti [INSTANCE_ID] dengan ID untuk instance yang diinginkan.

Menonaktifkan pemantauan kondisi

Untuk menonaktifkan layanan yang telah diaktifkan melalui cloud-config atau melalui skrip startup, hapus langkah systemctl start node-problem-detector, lalu mulai ulang instance OS yang Dioptimalkan untuk Penampung. Jika diaktifkan oleh metadata, pastikan kunci google-monitoring-enabled ditetapkan ke false.