Membuat kebijakan pemberitahuan untuk SLO
Halaman ini menjelaskan cara membuat kebijakan pemberitahuan di Cloud Monitoring untuk tujuan tingkat layanan (SLO) yang Anda buat di Cloud Service Mesh.
Untuk mempelajari pengantar SLO, lihat Ringkasan tujuan tingkat layanan.
Cloud Monitoring dapat memicu pemberitahuan saat Layanan berjalan sesuai rencana untuk melanggar SLO. Anda dapat membuat kebijakan pemberitahuan berdasarkan tingkat pemakaian anggaran error Anda. Semua pemberitahuan tentang anggaran error memiliki kondisi dasar yang sama: persentase anggaran error yang ditentukan untuk periode kepatuhan akan digunakan dalam periode lihat balik, yang merupakan jangka waktu, seperti 60 menit sebelumnya. Saat Anda membuat kebijakan pemberitahuan, Cloud Service Mesh akan otomatis menetapkan sebagian besar kondisi untuk pemberitahuan berdasarkan setelan di SLO. Anda menentukan periode lihat balik dan persentase konsumsi.
Menentukan nilai yang harus Anda tetapkan untuk periode lihat balik dan persentase konsumsi mungkin memerlukan beberapa uji coba. Anda dapat menggunakan periode lihat balik default 60 menit sebagai titik awal. Untuk menentukan persentase pemakaian, pantau perilaku layanan untuk melihat berapa persentase total anggaran error (selama periode kepatuhan) yang digunakan dalam 60 menit sebelumnya. Anda ingin menetapkan persentase pemakaian agar tidak menghabiskan lebih banyak anggaran error dalam periode lihat balik melebihi kemampuan Anda, tetapi tidak ingin menetapkan pemberitahuan jika tidak perlu.
Sebagai contoh, anggaplah Anda membuat SLO dengan nama berikut:
95% < 300ms Latency in Calendar Week
Dengan SLO ini, hanya 5% dari total jumlah permintaan dalam seminggu yang dapat memiliki latensi > 300 md. Mencapai atau melebihi 5% akan menghabiskan total anggaran error Anda. Jika Anda menetapkan periode lihat balik ke satu jam, setiap periode lihat balik adalah 1/168
dari periode kepatuhan Anda (ada 168 jam dalam seminggu). Untuk menghitung persentase konsumsi per jam yang tidak melebihi total anggaran error untuk minggu tersebut: 5%
÷ 168
≈ 0.03%
Karena latensi untuk Layanan Anda dapat berfluktuasi bergantung pada beban atau kondisi lainnya, menetapkan 0,03% karena persentase pemakaian dapat memicu pemberitahuan yang tidak diperlukan. Anda dapat memulai dengan nilai dua kali lipat, atau 0,06%, lalu memantau Layanan Anda dan menyesuaikan nilainya sesuai kebutuhan.
Sebelum memulai
Buat SLO untuk salah satu Layanan Anda.
Membuat kebijakan pemberitahuan pada SLO
Buka tab Kesehatan untuk layanan:
Di Konsol Google Cloud, buka Cloud Service Mesh.
Pilih project Google Cloud dari menu drop-down pada panel menu.
Klik layanan yang ingin Anda buatkan kebijakan pemberitahuannya.
Di menu navigasi sebelah kiri, klik Health.
Klik SLO yang ingin Anda buatkan kebijakan pemberitahuannya.
Di bagian Current Status of SLO di sebelah kanan, klik link Create Alerting Policy.
Dialog Tambahkan kondisi akan ditampilkan. Cloud Service Mesh secara otomatis mengisi kondisi SLO Burn Rate berdasarkan setelan dalam SLO. Konfigurasi kondisi Kecepatan Pemakaian SLO agar Anda mendapatkan pemberitahuan saat anggaran error SLO menurun terlalu cepat. Pastikan Anda mendapatkan pemberitahuan sebelum SLO kehabisan anggaran error.
Konfigurasi kondisi:
- Untuk memberi nama kondisi, klik link Judul yang disarankan untuk menggunakan nama berdasarkan SLO Anda, atau masukkan nama untuk kondisi tersebut.
- Di bagian Target, masukkan periode lihat balik di kolom Durasi Lihat Balik, atau gunakan nilai default.
- Di bagian Configuration, masukkan persentase konsumsi di kolom Threshold.
- Klik Simpan. Jendela Buat kebijakan pemberitahuan baru akan ditampilkan.
Konfigurasikan kebijakan pemberitahuan:
- Masukkan nama kebijakan.
- Kondisi ini akan otomatis diisi, tetapi Anda dapat menambahkan kondisi lain secara opsional.
- Jika kebijakan pemberitahuan hanya memiliki satu kondisi, biarkan kolom Pemicu kebijakan pada nilai default Kondisi apa pun terpenuhi.
- Secara opsional, konfigurasikan bagian Notifikasi dan Dokumentasi. Lihat Mengelola kebijakan pemberitahuan untuk mengetahui informasi selengkapnya.
- Klik Simpan. Halaman Detail kebijakan akan ditampilkan.
- Untuk kembali ke dasbor Cloud Service Mesh, klik Navigation menu dehaze lalu buka Anthos > Services.
Langkah selanjutnya
Pelajari lebih lanjut pemberitahuan dari Site Reliability Engineering di Google: