Halaman ini menjelaskan cara membuat kebijakan pemberitahuan di Cloud Monitoring untuk tujuan tingkat layanan (SLO) yang Anda buat di Anthos Service Mesh.
Untuk pengantar SLO, lihat Ringkasan tujuan tingkat layanan.
Cloud Monitoring dapat memicu pemberitahuan saat Layanan berjalan sesuai jalur untuk melanggar SLO. Anda dapat membuat kebijakan pemberitahuan berdasarkan tingkat pemakaian anggaran error. Semua pemberitahuan tentang anggaran error memiliki kondisi dasar yang sama: persentase anggaran error yang ditentukan selama periode kepatuhan digunakan dalam periode lihat balik, yang merupakan periode waktu, seperti 60 menit sebelumnya. Saat Anda membuat kebijakan pemberitahuan, Anthos Service Mesh secara otomatis menetapkan sebagian besar kondisi untuk pemberitahuan berdasarkan setelan di SLO. Anda menentukan periode lihat balik dan persentase konsumsi.
Menentukan nilai yang harus Anda tetapkan untuk periode lihat balik dan persentase konsumsi mungkin memerlukan beberapa uji coba. Anda dapat menggunakan periode lihat balik default selama 60 menit sebagai titik awal. Untuk menentukan persentase konsumsi, pantau perilaku layanan untuk melihat persentase total anggaran error (selama periode kepatuhan) yang digunakan dalam 60 menit sebelumnya. Anda ingin menetapkan persentase pemakaian agar anggaran error tidak menghabiskan lebih banyak anggaran error pada periode lihat balik melebihi kemampuan Anda, tetapi tidak ingin mempersiapkan pemberitahuan jika tidak perlu.
Misalnya, Anda membuat SLO dengan nama berikut: 95% < 300ms Latency in Calendar Week
Dengan SLO ini, hanya 5% dari total jumlah permintaan dalam seminggu yang dapat memiliki latensi > 300 milidetik. Mencapai atau melebihi 5% akan menghabiskan total anggaran error Anda. Jika Anda menetapkan periode lihat balik menjadi satu jam, setiap periode lihat balik adalah 1/168
dari periode kepatuhan Anda (ada 168 jam dalam seminggu). Untuk menghitung persentase konsumsi per jam yang tidak melebihi total anggaran error selama seminggu:
5%
÷ 168
≈ 0.03%
Karena latensi untuk Layanan Anda dapat berfluktuasi bergantung pada beban atau kondisi lainnya, menetapkan 0,03% sebagai persentase pemakaian dapat memicu pemberitahuan yang tidak perlu. Anda dapat memulai dengan nilai dua kali lipatnya, atau 0,06%, lalu memantau Layanan dan menyesuaikan nilainya sesuai kebutuhan.
Sebelum memulai
Buat SLO untuk salah satu Layanan Anda.
Membuat kebijakan pemberitahuan pada SLO
Buka tab Kesehatan untuk layanan:
Di konsol Google Cloud, buka Anthos Service Mesh.
Pilih project Google Cloud dari menu drop-down di panel menu.
Klik layanan yang kebijakan pemberitahuannya ingin Anda buat.
Di menu navigasi kiri, klik Kesehatan.
Klik SLO yang ingin Anda buatkan kebijakan pemberitahuan.
Di bagian Current Status of SLO di sebelah kanan, klik link Create Alerting Policy.
Dialog Add condition akan ditampilkan. Anthos Service Mesh secara otomatis mengisi kondisi SLO Burn Rate berdasarkan setelan di SLO. Anda mengonfigurasi kondisi SLO Burn Rate agar mendapatkan pemberitahuan saat anggaran error SLO menurun terlalu cepat. Pastikan Anda mendapatkan pemberitahuan sebelum SLO kehabisan anggaran error.
Konfigurasikan kondisi:
- Untuk menamai kondisi, klik link Judul yang disarankan untuk menggunakan nama berdasarkan SLO Anda, atau masukkan nama untuk kondisi tersebut.
- Di bagian Target, masukkan periode lihat balik di kolom Durasi Lihat Balik, atau gunakan nilai default.
- Di bagian Configuration, masukkan persentase konsumsi di kolom Threshold.
- Klik Simpan. Jendela Buat kebijakan pemberitahuan baru akan ditampilkan.
Konfigurasikan kebijakan pemberitahuan:
- Masukkan nama kebijakan.
- Kondisi ini diisi secara otomatis, tetapi jika ingin, Anda dapat menambahkan kondisi lain.
- Jika kebijakan pemberitahuan hanya memiliki satu kondisi, biarkan kolom Policy trigger di nilai default Any condition is met.
- Secara opsional, konfigurasikan bagian Notifikasi dan Dokumentasi. Lihat Mengelola kebijakan pemberitahuan untuk informasi selengkapnya.
- Klik Simpan. Halaman Detail kebijakan akan ditampilkan.
- Untuk kembali ke dasbor Anthos Service Mesh, klik Navigation menu dehaze dan buka Anthos > Services.
Langkah selanjutnya
Pelajari lebih lanjut pemberitahuan dari Site Reliability Engineering di Google: