Mulai dari Milestone 77, Container-Optimized OS menyertakan agen Node Problem Detector. Anda dapat menggunakan fitur ini untuk memantau kondisi sistem instance COS. Pendeteksi Masalah Node memantau kondisi instance dan melaporkan metrik terkait kondisi ke Cloud Monitoring, termasuk metrik kapasitas dan error yang kemudian dapat Anda visualisasikan dengan dasbor Google Cloud Observability. Metrik yang dikumpulkan dari konfigurasi default tidak dikenai biaya. Google akan menggunakan metrik gabungan untuk memahami masalah node dan meningkatkan keandalan Container-Optimized OS.
Agen telah dikonfigurasi sebelumnya dengan kumpulan metrik yang akan diekspor. Penyesuaian metrik yang dilaporkan untuk agen bawaan saat ini tidak didukung. Node Problem Detector adalah software open source. Anda dapat meninjau kode sumber dan konfigurasi di repositori sumber masing-masing.
Mengaktifkan pemantauan kondisi
Agen Node Problem Detector dinonaktifkan secara default pada waktu booting. Anda dapat mengaktifkan fitur ini menggunakan:
Menggunakan skrip startup
Anda dapat mengaktifkan Pendeteksi Masalah Node menggunakan skrip startup.
Menggunakan cloud-init
Contoh cloud-init
menjelaskan dasar-dasar konfigurasi instance Container-Optimized OS. Anda dapat
menggunakan cloud-init
untuk mengaktifkan pemantauan kondisi dengan contoh
cloud-config
berikut:
#cloud-config
runcmd:
- systemctl start node-problem-detector
Menggunakan metadata
Di Container-Optimized OS Milestone 88 dan yang lebih baru, Node Problem Detector juga dapat
diaktifkan dengan menetapkan nilai google-monitoring-enabled
ke true
di
bagian metadata kustom.
Untuk mengaktifkan pemantauan saat membuat instance:
gcloud compute instances create VM_NAME \ --image=IMAGE \ --image-project=cos-cloud \ --metadata=google-monitoring-enabled=true
Ganti kode berikut:
VM_NAME
: nama VM baruIMAGE
: versi tertentu dari image Container-Optimized OS publik. Contoh,--image=cos-113-18244-85-29
.
Untuk mengaktifkan pemantauan di instance yang ada:
gcloud compute instances add-metadata VM_NAME \ --metadata=google-monitoring-enabled=true
Ganti VM_NAME
dengan nama VM.
Mulai milestone 97, pemantauan dapat diaktifkan di metadata project:
gcloud compute project-info add-metadata \
--metadata google-monitoring-enabled=true
Setelah dieksekusi, layanan node-problem-detector akan diaktifkan.
Menggunakan kebijakan tamu yang ditentukan pengguna
Container-Optimized OS menyertakan agen OS Config, yang menggunakan utilitas sistem OS untuk mempertahankan status VM yang ditentukan dalam kebijakan tamu. Untuk mengetahui detail tentang kebijakan tamu, lihat Mengaktifkan agen OS Config dan Membuat kebijakan tamu. Kebijakan tamu berikut mengaktifkan agen Node problem detector di semua instance.
recipes:
- name: recipe-enable-npd
desiredState: INSTALLED
installSteps:
- scriptRun:
interpreter: SHELL
script: |-
#!/bin/bash
systemctl start node-problem-detector
Melihat metrik yang dikumpulkan
Pendeteksi Masalah Node melaporkan daftar metrik terhadap resource yang dipantau oleh instance Compute Engine.
Metrik didokumentasikan di Daftar metrik pemantauan, dengan awalan compute.googleapis.com/guest/
. Anda dapat melihat metrik yang dikumpulkan menggunakan Monitoring Metrics Explorer:
Di konsol Google Cloud, buka Monitoring atau gunakan tombol berikut:
Di panel navigasi Monitoring, klik Metrics Explorer.
Untuk jenis resource, pilih Instance VM Compute Engine.
Pilih metrik, misalnya "Jumlah Masalah".
Anda akan melihat diagram dan statistik di sisi kanan. Untuk melihat hasil untuk instance Container-Optimized OS tertentu, tetapkan filter ke
"instance_id=[INSTANCE_ID]"
, dengan mengganti [INSTANCE_ID] dengan ID untuk instance yang diinginkan.
Menonaktifkan pemantauan kondisi
Untuk menonaktifkan layanan yang telah diaktifkan melalui cloud-config
atau melalui skrip startup,
hapus langkah systemctl start node-problem-detector
, lalu mulai ulang
instance OS yang Dioptimalkan untuk Penampung. Jika diaktifkan oleh metadata, pastikan
kunci google-monitoring-enabled
ditetapkan ke false
.