Memantau instance dengan Cloud Monitoring

Dokumen ini menjelaskan cara menggunakan konsol Cloud Monitoring untuk memantau instance Spanner Anda.

Konsol Cloud Monitoring menyediakan beberapa alat pemantauan untuk Spanner:

Jika Anda lebih suka memantau Spanner secara terprogram, gunakan Library Klien Cloud untuk Cloud Monitoring guna mengambil metrik.

Menggunakan dasbor pilihan Cloud Monitoring

Cloud Monitoring menyediakan dasbor pilihan yang merangkum informasi utama tentang instance Spanner Anda, termasuk:

  • Insiden: Notifikasi pemantauan yang dibuat pengguna yang terbuka, aktif, atau diselesaikan
  • Peristiwa: Daftar log audit Spanner (jika diaktifkan dan tersedia)
  • Instance: Ringkasan umum instance Spanner Anda, termasuk kapasitas komputasi, jumlah database, dan kondisi instance
  • Diagram gabungan throughput dan penggunaan penyimpanan

Untuk melihat dasbor Spanner, lakukan tindakan berikut:

  1. Di konsol Google Cloud, pilih Monitoring, atau gunakan tombol berikut:

    Buka Monitoring

  2. Jika Resources ditampilkan di panel navigasi, pilih Resources, lalu pilih Cloud Spanner. Jika tidak, pilih Dasbor, lalu pilih dasbor yang bernama Cloud Spanner.

Melihat detail instance dan database

Saat Anda membuka dasbor pilihan untuk Spanner, dasbor ini akan menampilkan data gabungan untuk semua instance Anda. Anda dapat melihat detail selengkapnya tentang instance tertentu dengan mengklik nama instance di bagian Instance.

Dasbor menampilkan informasi seperti metadata instance, database dalam instance, dan diagram berbagai metrik yang dikelompokkan menurut region.

Dari halaman dasbor instance, Anda juga dapat melihat diagram untuk database tertentu dalam instance:

  1. Di sisi kanan, di atas diagram metrik instance, klik Metrik database.

  2. Di menu drop-down Pilih pengelompokan, pilih database yang ingin Anda periksa.

    Konsol Cloud Monitoring menampilkan diagram untuk database.

Membuat diagram kustom untuk metrik Spanner

Anda dapat menggunakan Cloud Monitoring untuk membuat diagram kustom untuk metrik Spanner. Anda dapat menggunakan Metrics Explorer untuk membuat diagram ad hoc sementara, atau membuat diagram yang muncul di dasbor kustom.

Secara khusus, Cloud Monitoring memungkinkan Anda membuat diagram kustom yang menunjukkan apakah dua metrik atau lebih berkorelasi satu sama lain. Misalnya, Anda dapat memeriksa korelasi antara penggunaan CPU dan latensi di instance Spanner, yang mungkin menunjukkan bahwa instance Anda memerlukan lebih banyak kapasitas komputasi atau bahwa beberapa kueri Anda menyebabkan penggunaan CPU yang tinggi.

Untuk memulai contoh ini, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, pilih Monitoring, atau gunakan tombol berikut:

    Buka Monitoring

  2. Jika Metrics Explorer ditampilkan di panel navigasi, pilih metrik tersebut. Jika tidak, pilih Resources, lalu pilih Metrics Explorer.

  3. Klik tab View options, lalu centang kotak Log scale on Y-axis. Opsi ini membantu Anda membandingkan beberapa metrik saat satu metrik memiliki nilai yang jauh lebih besar daripada yang lainnya.

  4. Pada menu drop-down di atas panel kanan, pilih Baris.

  5. Klik tab Metrik. Sekarang Anda dapat menambahkan metrik ke diagram.

Untuk menambahkan metrik latensi ke diagram, ikuti langkah-langkah berikut:

  1. Di kotak Find resource type and metric, masukkan nilai spanner.googleapis.com/api/request_latencies, lalu klik baris yang muncul di bawah kotak.
  2. Di kotak Filter, masukkan nilai instance_id, lalu masukkan ID instance yang ingin Anda periksa, lalu klik Apply.
  3. Di menu drop-down Aggregator, klik maks.
  4. Opsional: Ubah persentil latensi:

    1. Klik Tampilkan opsi lanjutan.
    2. Klik menu drop-down Aligner, lalu klik persentil latensi yang ingin Anda lihat.

      Pada umumnya, Anda harus melihat latensi persentil ke-50, untuk memahami jumlah latensi yang umum, atau latensi persentil ke-99, untuk memahami latensi untuk 1% permintaan terlambat.

Untuk menambahkan metrik penggunaan CPU ke diagram, ikuti langkah-langkah berikut:

  1. Klik Tambahkan metrik.
  2. Di kotak Find resource type and metric, masukkan nilai spanner.googleapis.com/instance/cpu/utilization, lalu klik baris yang muncul di bawah kotak.
  3. Di kotak Filter, masukkan nilai instance_id, lalu masukkan ID instance yang ingin Anda periksa, lalu klik Apply.
  4. Di menu drop-down Aggregator, klik maks.

Sekarang Anda memiliki diagram yang menampilkan metrik latensi dan penggunaan CPU untuk instance Spanner. Jika kedua metrik lebih tinggi dari yang diharapkan secara bersamaan, Anda dapat mengambil langkah tambahan untuk memperbaiki masalah tersebut.

Untuk mengetahui informasi selengkapnya tentang cara membuat diagram kustom, lihat dokumentasi Cloud Monitoring.

Membuat pemberitahuan untuk metrik Spanner

Saat membuat instance Spanner, Anda memilih kapasitas komputasi untuk instance tersebut. Saat beban kerja instance berubah, Spanner tidak otomatis menyesuaikan kapasitas komputasi instance. Oleh karena itu, Anda perlu menyiapkan beberapa pemberitahuan untuk memastikan instance tetap berada dalam maksimum yang direkomendasikan untuk penggunaan CPU dan batas yang direkomendasikan untuk penyimpanan.

Contoh berikut menunjukkan cara menyiapkan kebijakan pemberitahuan untuk beberapa metrik Spanner. Untuk mengetahui daftar lengkap metrik yang tersedia, lihat daftar metrik untuk Spanner.

CPU berprioritas tinggi

Untuk membuat kebijakan pemberitahuan yang terpicu saat penggunaan CPU prioritas tinggi untuk Spanner berada di atas nilai minimum yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Spanner Instance.
Di menu Metric categories, pilih Instance.
Di menu Metrics, pilih CPU Utilization by priority.

(metric.type adalah spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Di seluruh deret waktu
Mengelompokkan deret waktu menurut
location untuk instance multi-region;
kosongkan untuk instance regional.
Di seluruh deret waktu
Agregasi deret waktu
sum
Rolling window 10 m
Rolling window function mean
Kolom Configure alert trigger

Nilai
Condition type Threshold
Alert trigger Any time series violates
Threshold position Above threshold
Threshold value 45% untuk instance multi-region;
65% untuk instance regional.
Retest window 10 minutes

CPU rata-rata penggiliran 24 jam

Untuk membuat kebijakan pemberitahuan yang terpicu saat rata-rata bergulir 24 jam penggunaan CPU untuk Spanner berada di atas nilai minimum yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Spanner Instance.
Di menu Metric categories, pilih Instance.
Di menu Metrics, pilih Smoothed CPU utilization.

(metric.type adalah spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filter instance_id = YOUR_INSTANCE_ID
Across time series
Time series aggregation
sum
Rolling window 10 m
Rolling window function mean
Kolom Configure alert trigger

Nilai
Condition type Threshold
Alert trigger Any time series violates
Threshold position Above threshold
Nilai Minimum 90%
Retest window 10 minutes

Penyimpanan

Untuk membuat kebijakan pemberitahuan yang terpicu saat penyimpanan untuk instance Spanner Anda berada di atas nilai minimum yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Spanner Instance.
Di menu Metric categories, pilih Instance.
Di menu Metrics, pilih Storage used.

(metric.type adalah spanner.googleapis.com/instance/storage/utilization).
Filter instance_id = YOUR_INSTANCE_ID
Across time series
Time series aggregation
sum
Rolling window 10 m
Rolling window function max
Kolom Configure alert trigger

Nilai
Condition type Threshold
Pemicu kondisi jika Any time series violates
Threshold position Above threshold
Threshold value Anda tidak perlu menetapkan nilai minimum tertentu untuk penyimpanan maksimum per node. Namun, sebaiknya Anda menyiapkan pemberitahuan saat mendekati batas penyimpanan maksimum. Untuk mempelajari lebih lanjut, lihat Metrik penggunaan penyimpanan.
Retest window 10 minutes

Langkah selanjutnya