Mengamati dan memantau VM

Dokumen ini menjelaskan cara mengakses dan melihat metrik virtual machine (VM). Panduan ini juga menjelaskan cara meninjau metrik VM untuk mempelajari VM Anda lebih lanjut atau memecahkan masalah tertentu pada VM.

Memantau instance virtual machine (VM) sangat penting untuk mempertahankan resource VM Anda. Compute Engine menawarkan tampilan tingkat tinggi metrik VM Anda menggunakan tab Observability di Konsol Google Cloud. Tab ini menyediakan dasbor yang telah ditentukan sebelumnya menggunakan data telemetri, sehingga Anda dapat memantau VM dan membuat keputusan yang tepat terkait resource Compute Engine. Anda juga dapat menyesuaikan dasbor standar untuk hanya melihat metrik tertentu yang Anda inginkan.

Semua VM memiliki data pemanfaatan proses dasar yang tersedia saat dibuat. Namun, menginstal Agen Operasional akan memberikan insight yang lebih mendalam tentang perilaku VM.

Untuk mengetahui informasi selengkapnya tentang cara membuat kebijakan pemberitahuan pemantauan, menggunakan Metrics Explorer, atau untuk informasi umum tentang cara kerja pemantauan dan metrik di Google Cloud, lihat dokumen Cloud Monitoring.

Sebelum memulai

Opsional: Instal Agen Operasional untuk mengumpulkan data yang lebih mendetail dari instance Compute Engine Anda.

Untuk memeriksa instance VM mana yang telah menginstal Agen Operasional, lakukan hal berikut:

Di konsol Google Cloud, buka Dasbor Monitoring

Buka Dasbor Monitoring
Pilih VM instances dari daftar dasbor.
Klik List untuk melihat VM sebagai daftar.

Semua VM di project Anda akan ditampilkan. Kolom Agen menampilkan status penginstalan Agen Operasional. Anda dapat menginstal atau mengupdate agen dari halaman ini.

Mengakses metrik kemampuan observasi VM

Akses informasi untuk satu atau beberapa VM menggunakan tab Kemampuan observasi di Konsol Google Cloud. Secara default, dasbor standar menampilkan metrik VM. Jika Anda hanya ingin melihat metrik tertentu yang diinginkan, Anda dapat membuat dasbor yang disesuaikan.

Melihat metrik kemampuan observasi untuk satu VM

Metrik VM dasar, seperti pemakaian CPU dan traffic jaringan, tersedia saat Anda membuat VM. Metrik untuk pemanfaatan memori dan proses hanya tersedia dengan penginstalan Agen Operasional, yang merupakan agen utama untuk mengumpulkan telemetri dari instance Compute Engine Anda.

Untuk melihat metrik untuk satu VM, lakukan hal berikut:

Di konsol Google Cloud, buka halaman Instance VM.

Buka Instance VM
Pilih VM untuk membuka halaman Detail.
Klik tab Observability untuk menampilkan informasi tentang VM.
Opsional: Reset jangka waktu default satu jam ke jangka waktu yang ingin Anda pantau.

Informasi di Gambar 1 menampilkan detail VM tanpa Agen Operasional diinstal pada VM. Perhatikan bahwa grafik Memory dan Disk Space Utilization tidak memiliki data.

Tab kemampuan observasi untuk satu VM tanpa menginstal Agen Operasional. — *Gambar 1*: Tab **Kemampuan observasi** untuk satu VM tanpa menginstal Agen Operasional.

Melihat metrik kemampuan observasi untuk beberapa VM

Kemampuan observasi di tingkat fleet menampilkan metrik untuk lima VM teratas dengan penggunaan proses tertinggi. Lima VM teratas yang tercantum bervariasi berdasarkan metrik. Anda mungkin tidak melihat lima VM yang sama untuk setiap proses. Meskipun ada lebih banyak data yang tersedia di tingkat fleet tanpa menginstal Agen Operasional dibandingkan dengan jumlah data yang tersedia untuk satu VM, menginstal agen akan memberikan lebih banyak data untuk tujuan pemecahan masalah di masa mendatang.

Untuk melihat metrik beberapa VM, lakukan hal berikut:

Di Konsol Google Cloud, buka halaman Instance VM.

Buka instance VM
Klik tab Kemampuan observasi.
Opsional: Reset jangka waktu default satu jam ke jangka waktu yang ingin Anda pantau.
Filter hasil menurut satu atau beberapa opsi berikut:
- ID
- Nama
- Machine type
- Zone
- Region
- Instance group
- Label
- Status

Informasi pada Gambar 2 menampilkan contoh tab Kemampuan observasi saat beberapa VM dalam suatu project telah menginstal Agen Operasional. Perhatikan bahwa ada lebih banyak metrik yang tersedia tentang VM ini.

Beberapa instance VM dengan Agen Operasional terinstal. — *Gambar 2*: Beberapa **instance VM** dengan Agen Operasional terinstal.

Melihat metrik mendetail untuk VM

Setiap metrik proses VM diwakili oleh garis grafik pada diagram. Dalam contoh berikut, VM uptime-demo telah menginstal Agen Operasional. Data penggunaan memori tersedia untuk tujuan pemecahan masalah. Jika VM tidak tercantum di kartu, filter menurut nama VM untuk menemukan VM tertentu.

Untuk mengambil informasi tentang VM ini atau VM lainnya dari lima VM teratas dari tab Kemampuan observasi, lakukan langkah berikut:

Tahan kursor di atas garis grafik VM apa pun. Sebuah kartu akan muncul dengan daftar lima VM teratas yang menggunakan proses tersebut, dan masing-masing menampilkan sebuah metrik.
Untuk mempelajari lebih lanjut perilaku VM, klik garis grafik VM atau nama VM tertentu dalam daftar.

VM uptime-demo yang ditampilkan pada kartu di Gambar 3 mengungkapkan beberapa metrik yang mungkin memerlukan peninjauan.

Garis grafik merepresentasikan VM. Klik untuk mempelajari lebih lanjut informasi tentang VM tertentu. — *Gambar 3*: Garis grafik merepresentasikan VM. Klik untuk mempelajari VM tertentu lebih lanjut.

Klik VM uptime-demo untuk membuka halaman VM Details yang ditampilkan pada Gambar 4, yang memberikan informasi berikut:

Status Agen Operasional.
Opsi dalam konteks untuk membuat Alerts, memeriksa Events, atau membuat Uptime Checks.
Opsi untuk melihat detail konfigurasi, metrik, dan log VM.

*Gambar 4*: Halaman Detail VM menyediakan informasi tentang VM tertentu.

Membuat dasbor yang disesuaikan untuk melihat metrik tertentu

Secara default, tab Observability di Compute Engine menyediakan dasbor standar yang menampilkan metrik VM dasar. Untuk melihat metrik tertentu saja yang ingin Anda lihat, Anda dapat mengubah dasbor standar dan menyimpannya sebagai dasbor yang disesuaikan. Anda dapat menyesuaikan dasbor sesuai kebutuhan.

Untuk membuat dasbor yang disesuaikan, lakukan hal berikut:

Di konsol Google Cloud, buka halaman Instance VM.

Buka instance VM
Buka tab Observability sebagai berikut:
- Untuk satu VM: Di halaman VM instances, klik nama VM untuk membuka halaman Details-nya, lalu klik tab Observability untuk VM tersebut.
- Untuk beberapa VM: Di halaman VM instances, klik tab Observability.
Jika drop-down Dasbor diaktifkan, dasbor yang disesuaikan akan tersedia. Untuk mengubah tampilan kustom, pilih tampilan kustom dari drop-down, lalu, di toolbar dasbor, klik .
Atau, untuk menyesuaikan dasbor yang telah ditentukan, di toolbar dasbor, klik .

Compute Engine membuat salinan dasbor standar, lalu membuka salinan tersebut dalam mode edit.
Di editor, Anda dapat menambahkan, mengubah, menghapus, memosisikan ulang, atau mengubah ukuran visualisasi di dasbor. Visualisasi ini secara kolektif disebut widget. Untuk mengetahui informasi selengkapnya tentang berbagai jenis widget, lihat Ringkasan dasbor.
- Untuk menambahkan widget, di toolbar dasbor, klik Add widget, lalu selesaikan konfigurasi.
  
  Misalnya, untuk melihat log dengan data metrik Anda, klik Add widget, pilih Logs, lalu klik Apply.
- Untuk mengubah widget, arahkan kursor ke widget untuk mengaktifkan toolbar, klik Edit widget, lalu gunakan dialog Configure widget. Untuk menerapkan perubahan ke dasbor, klik Apply di toolbar. Untuk menghapus perubahan, klik Batal.
- Untuk menghapus widget, tempatkan kursor Anda pada widget untuk mengaktifkan toolbar, klik Opsi diagram lainnya, lalu pilih Hapus.
- Untuk mengubah posisi widget, gunakan pointer untuk menarik widget melalui header-nya ke lokasi baru.
- Untuk mengubah ukuran widget, gunakan pointer untuk mengubah posisi sudut kanan widget.
Setelah Anda selesai memodifikasi dasbor, klik Simpan.
Pada dialog yang mengonfirmasi perubahan, klik Viewjaga dasbor untuk membuka tampilan yang disesuaikan.

Anda dapat beralih kembali ke tampilan standar dengan memilih Standar dari menu drop-down Dasbor.

Meninjau metrik resource

Untuk mempelajari setiap metrik resource lebih lanjut, klik setiap proses dalam menu tab Kemampuan observasi:

Pelajari CPU, Proses, penggunaan Memori, traffic Jaringan, dan Disk.
Lihat data log dengan menelusuri Logs untuk mengidentifikasi dan melihat Peristiwa Sistem.
Tambahkan Integrasi pihak ketiga dan periksa integrasi yang sudah Dikonfigurasi.

Bagian ini selanjutnya menjelaskan contoh bagaimana beberapa proses dapat memengaruhi workload Anda. Informasi ini mengasumsikan bahwa Agen Operasional diinstal pada VM Anda.

CPU utilization

Contoh pemakaian CPU yang ekstrem mungkin terjadi saat server mengalami beban berat yang tidak terduga, seperti saat situs mengalami lonjakan traffic yang tiba-tiba atau saat tugas pemrosesan data berskala besar sedang berlangsung. Dalam situasi seperti ini, CPU mungkin berjalan pada kapasitas 100% dalam waktu lama, yang dapat menyebabkan server melambat atau tidak responsif.

Dalam contoh ini, saturasi yang menjadi perhatiannya. Jika pemakaian CPU Anda mencapai 100%, mungkin hal tersebut tidak masalah untuk workload Anda. Namun, sebaiknya periksa metrik lain untuk mengetahui apakah hal ini memerlukan intervensi atau tidak. Dalam hal ini, sebaiknya Anda membuat kebijakan pemberitahuan agar diberi tahu saat penggunaan CPU VM melonjak.

Dengan izin yang tepat, Anda dapat terhubung menggunakan SSH ke VM untuk menyelidiki masalah. Namun, jika Agen Operasional diinstal, Anda dapat melihat data historis selengkapnya untuk membantu memecahkan masalah.

Penggunaan proses

Contoh perilaku proses yang ekstrem mungkin saat suatu proses menggunakan resource seperti CPU, memori, atau I/O disk secara berlebihan, hingga menyebabkan penurunan performa atau bahkan error pada VM.

Misalnya, jika proses yang berjalan pada VM mengalami kebocoran memori, proses tersebut mungkin mulai menggunakan memori yang semakin besar seiring waktu, yang pada akhirnya menyebabkan VM kehabisan memori dan error. Demikian pula, jika suatu proses sering menggunakan disk, hal ini dapat menyebabkan I/O disk VM menjadi penuh, sehingga menyebabkan waktu respons yang lambat untuk proses lainnya.

Pemakaian memori

Database memerlukan memori dalam jumlah besar untuk melakukan operasi seperti mengindeks, mengurutkan, dan menggabungkan tabel.

Contoh penggunaan memori yang tinggi pada VM adalah saat Anda menjalankan server database, seperti Cloud SQL untuk MySQL atau Cloud SQL untuk PostgreSQL, dengan set data yang besar. Jika memori yang tersedia di VM Anda terlalu kecil, memuat ulang set data ke dalam memori dapat menyebabkan database berjalan lambat atau error.

Performa jaringan

Masalah performa jaringan disebabkan oleh berbagai faktor: kemacetan, batasan bandwidth, masalah hardware atau software, dan latensi. Untuk mendiagnosis masalah, pantau metrik performa jaringan, pecahkan masalah hardware dan software, serta analisis pola traffic jaringan untuk mengidentifikasi dan mengatasi akar masalah.

Pemanfaatan disk

Penggunaan disk yang tinggi pada VM terjadi saat ada banyak data yang dibaca ke atau ditulis dari disk virtual yang mengakibatkan penundaan akses disk dan kemungkinan pengaruh terhadap performa VM.

Memantau metrik pemakaian disk, seperti operasi I/O disk per detik (IOPS), panjang antrean disk, dan waktu respons disk rata-rata dapat membantu mengidentifikasi dan mendiagnosis masalah penggunaan disk yang tinggi di VM.

Memeriksa log dan peristiwa sistem

Halaman Semua Log menyediakan data log tentang resource Anda. Urutkan berdasarkan tingkat keparahan untuk mengidentifikasi masalah dan memeriksa payload.

Log audit mencatat peristiwa administratif yang terjadi di resource Anda. Log dapat memberi tahu Anda apa yang terjadi untuk memicu peristiwa. Beberapa log dicatat dan dikelola di baris yang sama. Jadi, misalnya, jika Anda memiliki 20 log yang identik, informasinya akan disimpan dalam satu baris, bukan 20 baris terpisah.

Anda dapat menganggap Peristiwa Sistem sebagai istilah umum untuk peristiwa yang terjadi pada level yang lebih tinggi, tetapi dapat memengaruhi resource Compute Engine Anda. Peristiwa sistem terjadi saat error yang tidak terkait dengan peristiwa yang direncanakan dipicu. Peristiwa sistem dicatat pada level fleet.

Menggunakan integrasi pihak ketiga

Monitoring menyediakan integrasi dengan aplikasi pihak ketiga. Integrasi ini memungkinkan Anda mengumpulkan telemetri dari aplikasi seperti Apache Web Server, Cloud SQL untuk MySQL, Memorystore untuk Redis, dan lainnya untuk deployment yang berjalan di Compute Engine dan GKE. Saat Anda menggunakan Compute Engine, telemetri pihak ketiga dikumpulkan oleh Agen Operasional.