Memantau instance dengan Cloud Monitoring

Dokumen ini menjelaskan cara menggunakan konsol Cloud Monitoring untuk memantau instance Spanner Anda.

Konsol Cloud Monitoring menyediakan beberapa alat pemantauan untuk Spanner:

Jika Anda lebih memilih untuk memantau Spanner secara terprogram, gunakan Library Klien Cloud untuk Cloud Monitoring untuk mengambil metrik.

Menggunakan dasbor pilihan Cloud Monitoring

Cloud Monitoring menyediakan dasbor pilihan yang merangkum informasi utama tentang instance Spanner, termasuk:

  • Insiden: Pemberitahuan pemantauan yang dibuat pengguna yang terbuka, aktif, atau diselesaikan
  • Peristiwa: Daftar log audit Spanner (jika diaktifkan dan tersedia)
  • Instance: Ringkasan tingkat tinggi dari instance Spanner Anda, termasuk kapasitas komputasi, jumlah database, dan kondisi instance
  • Diagram gabungan throughput dan penggunaan penyimpanan

Untuk melihat dasbor Spanner, lakukan hal berikut:

  1. Di konsol Google Cloud, pilih Monitoring, atau gunakan tombol berikut:

    Buka Monitoring

  2. Jika Resources ditampilkan di panel navigasi, pilih Resources lalu pilih Cloud Spanner. Atau, pilih Dashboards, lalu pilih dasbor bernama Cloud Spanner.

Melihat detail instance dan database

Saat Anda membuka dasbor pilihan untuk Spanner, dasbor ini akan menampilkan data gabungan untuk semua instance Anda. Anda dapat melihat detail selengkapnya tentang instance tertentu dengan mengklik nama instance di bagian Instances.

Dasbor menampilkan informasi seperti metadata instance, database dalam instance, dan diagram berbagai metrik yang dikelompokkan berdasarkan region.

Dari halaman dasbor instance, Anda juga dapat melihat diagram untuk database tertentu dalam instance:

  1. Di sisi kanan, di atas diagram metrik instance, klik Database metrics.

  2. Di menu drop-down Select a breakdown, pilih database yang ingin Anda periksa.

    Konsol Cloud Monitoring menampilkan diagram untuk database.

Membuat diagram kustom untuk metrik Spanner

Anda dapat menggunakan Cloud Monitoring untuk membuat diagram kustom untuk metrik Spanner. Anda dapat menggunakan Metrics Explorer untuk membuat diagram ad-hoc sementara, atau Anda dapat membuat diagram yang muncul di dasbor kustom.

Secara khusus, Cloud Monitoring memungkinkan Anda membuat diagram kustom yang menunjukkan apakah dua metrik atau lebih saling berkorelasi. Misalnya, Anda dapat memeriksa korelasi antara penggunaan CPU dan latensi di instance Spanner, yang mungkin menunjukkan bahwa instance Anda memerlukan kapasitas komputasi yang lebih besar atau bahwa beberapa kueri Anda menyebabkan penggunaan CPU yang tinggi.

Untuk memulai dengan contoh ini, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, pilih Monitoring, atau gunakan tombol berikut:

    Buka Monitoring

  2. Pilih Metrics Explorer di panel navigasi. Jika tidak, pilih Resources, lalu pilih Metrics Explorer.

  3. Klik tab View options, lalu centang kotak Log scale on Y-axis. Opsi ini membantu Anda membandingkan beberapa metrik jika satu metrik memiliki nilai yang jauh lebih besar daripada metrik lainnya.

  4. Pada menu drop-down di atas panel kanan, pilih Line.

  5. Klik tab Metrik. Sekarang Anda dapat menambahkan metrik ke diagram.

Untuk menambahkan metrik latensi ke diagram, ikuti langkah-langkah berikut:

  1. Di kotak Find resource type and metric, masukkan nilai spanner.googleapis.com/api/request_latencies, lalu klik baris yang muncul di bawah kotak.
  2. Di kotak Filter, masukkan nilai instance_id, lalu masukkan ID instance yang ingin Anda periksa dan klik Apply.
  3. Di menu drop-down Aggregator, klik maks.
  4. Opsional: Ubah persentil latensi:

    1. Klik Tampilkan opsi lanjutan.
    2. Klik menu drop-down Aligner, lalu klik persentil latensi yang ingin Anda lihat.

      Pada umumnya, Anda harus melihat latensi persentil ke-50, untuk memahami jumlah latensi umum, atau latensi persentil ke-99, guna memahami latensi untuk 1% permintaan yang paling lambat.

Untuk menambahkan metrik pemakaian CPU ke diagram, ikuti langkah-langkah berikut:

  1. Klik Tambahkan metrik.
  2. Di kotak Find resource type and metric, masukkan nilai spanner.googleapis.com/instance/cpu/utilization, lalu klik baris yang muncul di bawah kotak.
  3. Di kotak Filter, masukkan nilai instance_id, lalu masukkan ID instance yang ingin Anda periksa dan klik Apply.
  4. Di menu drop-down Aggregator, klik maks.

Anda kini memiliki diagram yang menunjukkan metrik latensi dan pemakaian CPU untuk instance Spanner. Jika kedua metrik lebih tinggi dari yang diharapkan pada saat yang sama, Anda dapat mengambil langkah tambahan untuk memperbaiki masalah ini.

Untuk mengetahui informasi selengkapnya tentang cara membuat diagram kustom, lihat dokumentasi Cloud Monitoring.

Membuat pemberitahuan untuk metrik Spanner

Saat membuat instance Spanner, Anda memilih kapasitas komputasi untuk instance tersebut. Saat beban kerja instance berubah, Spanner tidak secara otomatis menyesuaikan kapasitas komputasi instance. Akibatnya, Anda perlu menyiapkan beberapa pemberitahuan untuk memastikan bahwa instance tetap berada dalam jumlah maksimum yang direkomendasikan untuk penggunaan CPU dan batas penyimpanan yang direkomendasikan.

Contoh berikut menunjukkan cara menyiapkan kebijakan pemberitahuan untuk beberapa metrik Spanner. Untuk daftar lengkap metrik yang tersedia, lihat daftar metrik untuk Spanner.

CPU prioritas tinggi

Untuk membuat kebijakan pemberitahuan yang terpicu saat pemakaian CPU prioritas tinggi untuk Spanner melebihi batas yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Cloud Spanner Instance.
Di menu Kategori metrik, pilih Instance.
Di menu Metrics, pilih CPU Utilization by Priority.

(Metrik.type adalah spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Di seluruh deret waktu
Mengelompokkan deret waktu menurut
location untuk instance multi-region;
kosongkan untuk instance regional.
Di seluruh deret waktu
Agregasi deret waktu
sum
Rolling window 10 m
Rolling window function mean
Kolom Configure alert trigger

Nilai
Condition type Threshold
Alert trigger Any time series violates
Threshold position Above threshold
Threshold value 45% untuk instance multi-region;
65% untuk instance regional.
Retest window 10 minutes

CPU rata-rata penggiliran 24 jam

Untuk membuat kebijakan pemberitahuan yang terpicu saat rata-rata penggiliran 24 jam dari penggunaan CPU untuk Spanner berada di atas batas yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Cloud Spanner Instance.
Di menu Kategori metrik, pilih Instance.
Di menu Metrics, pilih Smoothed CPU utilization.

(Metrik.type adalah spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filter instance_id = YOUR_INSTANCE_ID
Across time series
Time series aggregation
sum
Rolling window 10 m
Rolling window function mean
Kolom Configure alert trigger

Nilai
Condition type Threshold
Alert trigger Any time series violates
Threshold position Above threshold
Batas 90%
Retest window 10 minutes

Penyimpanan

Untuk membuat kebijakan pemberitahuan yang terpicu saat penyimpanan untuk instance Spanner Anda di atas batas yang direkomendasikan, gunakan setelan berikut.

Kolom New condition

Nilai
Resource and Metric Di menu Resources, pilih Cloud Spanner Instance.
Di menu Kategori metrik, pilih Instance.
Di menu Metrics, pilih Storage used.

(Metrik.type adalah spanner.googleapis.com/instance/storage/utilization).
Filter instance_id = YOUR_INSTANCE_ID
Across time series
Time series aggregation
sum
Rolling window 10 m
Rolling window function max
Kolom Configure alert trigger

Nilai
Condition type Threshold
Kondisi terpicu jika Any time series violates
Threshold position Above threshold
Threshold value Tetapkan batas ke 75% penyimpanan maksimum per node, dikalikan dengan jumlah node. Untuk batas node saat ini, lihat Kuota & batas Spanner.
Retest window 10 minutes

Langkah selanjutnya