Memecahkan masalah performa VM


Dokumen ini menunjukkan cara mendiagnosis dan memitigasi masalah performa CPU, memori, dan penyimpanan pada instance virtual machine (VM) Compute Engine.

Sebelum memulai

Melihat metrik performa

Untuk melihat metrik performa VM Anda, gunakan metrik kemampuan observasi Cloud Monitoring yang tersedia di konsol Google Cloud.

  1. Di konsol Google Cloud, buka halaman Instance VM.

    Buka Instance VM

  2. Anda dapat melihat metrik untuk setiap VM atau untuk lima VM yang paling banyak menggunakan resource.

    Untuk melihat metrik setiap VM, lakukan tindakan berikut:

    1. Klik nama VM yang ingin Anda lihat metrik performanya. Halaman Detail instance VM akan terbuka.

    2. Klik tab Kemampuan observasi untuk membuka halaman Ringkasan Kemampuan observasi.

    Untuk melihat metrik lima VM yang paling banyak menggunakan resource, klik tab Kemampuan observasi di halaman Instance VM.

  3. Pelajari metrik performa VM. Lihat bagian Ringkasan, CPU, Memori, Jaringan, dan Disk untuk melihat metrik yang terperinci tentang setiap topik. Berikut adalah metrik utama yang menunjukkan performa VM:

    • Di halaman Ringkasan:

      • Penggunaan CPU. Persentase CPU yang digunakan oleh VM.

      • Pemakaian Memori. Persentase memori yang digunakan oleh VM, tidak termasuk cache disk. Untuk VM Linux, ini juga tidak termasuk memori kernel.

      • Traffic Jaringan. Tingkat rata-rata byte yang dikirim dan diterima dalam interval satu menit.

      • Koneksi Baru dengan VM/Eksternal/Google. Perkiraan jumlah alur TCP/UDP yang berbeda dalam satu menit, yang dikelompokkan berdasarkan jenis pembanding.

      • Throughput Disk. Tingkat rata-rata byte yang ditulis ke dan dibaca dari disk.

      • IOPS Disk. Tingkat rata-rata operasi baca dan tulis I/O ke disk.

    • Di halaman Ringkasan Jaringan:

      • Dikirim ke VM/Eksternal/Google. Tingkat laju traffic jaringan yang dikirim ke layanan Google, VM, dan tujuan eksternal, berdasarkan sampel paket. Metrik diskalakan sehingga jumlahnya cocok dengan total traffic jaringan yang dikirim.

      • Diterima dari VM/Eksternal/Google. Tingkat traffic jaringan yang diterima dari layanan Google, VM, dan sumber eksternal, berdasarkan sampel paket. Metrik diskalakan sehingga jumlahnya cocok dengan total traffic jaringan yang diterima.

      • Total Paket Jaringan. Tingkat total paket yang dikirim dan diterima dalam interval satu menit.

      • Ukuran Rata-Rata Paket. Ukuran rata-rata paket, dalam byte, yang dikirim dan diterima dalam interval satu menit.

      • Paket Masuk Ditolak Firewall. Tingkat paket jaringan masuk yang dikirim ke VM, tetapi tidak diterima oleh VM, karena ditolak oleh aturan firewall.

    • Di halaman Performa Disk:

      • Rata-Rata Ukuran I/O. Ukuran rata-rata operasi baca dan tulis I/O ke disk. I/O acak kecil (4-16 KiB) biasanya dibatasi oleh IOPS dan I/O berurutan/besar (256 KiB-1 MiB) biasanya dibatasi oleh throughput.

      • Rata-Rata Panjang Antrean. Jumlah operasi I/O disk dalam antrean dan yang berjalan, disebut juga kedalaman antrean, untuk 5 perangkat teratas. Untuk mencapai batas performa persistent disk, gunakan kedalaman antrean I/O tinggi. Persistent disk adalah penyimpanan dalam jaringan dan umumnya memiliki latensi lebih tinggi dibandingkan dengan disk fisik atau SSD lokal.

      • Rata-Rata Latensi I/O. Latensi rata-rata operasi baca dan tulis I/O yang digabungkan di seluruh operasi dari semua disk yang terpasang pada VM, yang diukur oleh Agen Operasional di VM. Nilai ini mencakup latensi pemrosesan sistem operasi dan sistem file, dan bergantung pada panjang antrean dan ukuran I/O.

Memahami metrik performa

Performa VM dipengaruhi oleh hardware yang digunakan untuk menjalankan VM, workload yang berjalan pada VM, dan jenis mesin VM. Jika hardware tidak dapat mendukung workload atau traffic jaringan VM, performa VM Anda mungkin akan terpengaruh.

Performa CPU dan memori

Detail hardware

Performa CPU dan memori dipengaruhi oleh batasan hardware berikut:

  • Setiap CPU virtual (vCPU) diimplementasikan sebagai hardware multi-thread tunggal pada prosesor CPU.
  • Prosesor CPU Intel Xeon mendukung beberapa thread aplikasi pada satu inti prosesor.
  • VM yang menggunakan jenis mesin C2 memiliki pemetaan inti virtual ke fisik yang tetap dan mengekspos arsitektur sel NUMA ke OS tamu.
  • Sebagian besar VM mendapatkan frekuensi all-core turbo yang tercantum di platform CPU, meskipun hanya frekuensi dasar yang diberitahukan ke lingkungan tamu
  • Jenis mesin dengan inti bersama menggunakan pengalihan konteks untuk berbagi inti fisik antar- vCPU untuk multitasking. Jenis ini juga menawarkan kemampuan bursting sehingga pemakaian CPU untuk VM dapat lebih dari 100%. Untuk mengetahui informasi selengkapnya, lihat Jenis mesin dengan inti bersama.

Untuk memahami performa CPU dan memori VM, lihat metrik performa untuk Pemakaian CPU dan Pemakaian Memori. Anda juga dapat menggunakan metrik proses untuk melihat proses yang sedang berjalan, mengatribusikan anomali dalam konsumsi resource ke proses tertentu, atau mengidentifikasi pemakai resource VM yang paling mahal.

Pemakaian CPU atau memori yang tinggi secara konsisten menunjukkan perlunya meningkatkan skala VM. Jika VM secara konsisten menggunakan lebih dari 90% CPU atau memorinya, ubah jenis mesin VM ke jenis mesin dengan vCPU atau memori yang lebih banyak.

Performa jaringan

Detail hardware

Performa jaringan dipengaruhi oleh batasan hardware berikut:

Untuk memahami performa jaringan VM, lihat metrik performa untuk Total Paket Jaringan, Ukuran Rata-Rata Paket, Koneksi Baru dengan VM/Eksternal/Google, Dikirim ke VM/Eksternal/Google, Diterima dari VM/Eksternal/Google, dan Paket Masuk Ditolak Firewall.

Tinjau apakah Total Paket Jaringan, Ukuran Rata-Rata Paket, dan Koneksi Baru dengan VM/Eksternal/Google sudah standar untuk workload Anda. Misalnya, server web mungkin mengalami banyak koneksi dan paket kecil, sementara database mungkin mengalami sedikit koneksi dan paket besar.

Traffic jaringan keluar yang tinggi secara konsisten dapat mengindikasikan perlunya mengubah jenis mesin VM menjadi jenis mesin yang memiliki batas bandwidth keluar yang lebih tinggi.

Jika Anda melihat banyak paket masuk yang ditolak oleh firewall, buka halaman Analisis Firewall Kecerdasan Jaringan di konsol Google Cloud untuk mempelajari lebih lanjut asal paket yang ditolak.

Buka halaman Analisis Firewall

Jika menurut Anda traffic Anda sendiri tidak seharusnya ditolak oleh firewall, coba jalankan uji konektivitas.

Jika VM Anda mengirim dan menerima jumlah traffic yang tinggi dari VM di berbagai zona atau region, pertimbangkan untuk mengubah workload Anda untuk menyimpan lebih banyak data dalam suatu zona atau region untuk meningkatkan latensi dan mengurangi biaya. Untuk mengetahui informasi selengkapnya, lihat "Harga transfer data keluar VM-VM dalam Google Cloud" di halaman harga. Jika VM Anda mengirim sejumlah besar traffic ke VM lain dalam zona yang sama, pertimbangkan kebijakan penempatan yang ringkas untuk mencapai latensi jaringan yang rendah.

Performa penyimpanan

Detail hardware

Penyimpanan terpengaruh oleh batasan hardware berikut:

  • Ukuran total semua persistent disk yang digabungkan dengan jumlah vCPU menentukan total performa penyimpanan. Jika terdapat berbagai jenis persistent disk yang terpasang ke VM, batas performa persistent disk SSD akan digunakan bersama oleh semua disk di VM. Untuk mengetahui informasi selengkapnya,lihat Performa block storage.
  • Jika Persistent Disk dan Hyperdisk bersaing dengan traffic transfer data keluar, 60% dari bandwidth jaringan keluar maksimum digunakan untuk Persistent Disk dan Hyperdisk, dan 40% sisanya dapat digunakan untuk transfer data jaringan keluar. Untuk informasi selengkapnya, lihat Faktor lain yang memengaruhi performa.
  • Performa ukuran I/O dan kedalaman antrean bergantung pada workload. Beberapa workload mungkin tidak cukup besar untuk menggunakan batas performa ukuran I/O penuh dan kedalaman antrean.
  • Jenis mesin VM memengaruhi performa penyimpanannya. Untuk informasi selengkapnya, lihat Jenis mesin dan jumlah vCPU.

Untuk memahami performa penyimpanan VM, lihat metrik performa untuk Throughput, Operasi (IOPS), I/Ukuran O, Latensi I/O, dan Panjang Antrean.

Throughput disk dan IOPS menunjukkan apakah workload VM beroperasi seperti yang diharapkan. Jika throughput atau IOPS lebih rendah dari jumlah maksimum yang diharapkan yang tercantum dalam diagram jenis disk, mungkin ada masalah ukuran I/O, panjang antrean, atau performa latensi I/O.

Anda dapat memperkirakan ukuran I/O antara 4-16 KiB untuk workload yang memerlukan IOPS tinggi dan latensi rendah, dan 256 KiB-1 MiB untuk workload yang melibatkan ukuran tulis berurutan atau besar. Ukuran I/O di luar rentang ini menunjukkan masalah performa disk.

Panjang antrean, yang juga dikenal sebagai kedalaman antrean, merupakan faktor throughput dan IOPS. Jika disk berperforma baik, panjang antreannya seharusnya sama dengan panjang antrean yang direkomendasikan untuk mencapai level throughput atau IOPS tertentu, yang tercantum dalam diagram Kedalaman antrean I/O yang direkomendasikan.

Latensi I/O bergantung pada panjang antrean dan ukuran I/O. Jika panjang antrean atau ukuran I/O untuk disk tinggi, latensi juga akan tinggi.

Jika ada metrik performa penyimpanan yang menunjukkan masalah performa disk, lakukan satu atau beberapa tindakan berikut: