Memberi pemberitahuan tentang laju pengeluaran

Anda dapat membuat kebijakan pemberitahuan pada tujuan tingkat layanan (SLO) untuk memberi tahu apakah Anda berisiko melanggar SLO. Anda memilih SLO yang ingin dipantau, lalu mengonfigurasi kebijakan pemberitahuan untuk memantau SLO tersebut. Kondisi biasanya dinyatakan dengan memilih nilai minimum yang merupakan pelanggaran, dan periode yang mengizinkan pelanggaran. Jika nilai minimum terlampaui selama lebih dari periode yang diizinkan, kebijakan pemberitahuan akan dipicu.

Halaman ini menjelaskan pemberitahuan tentang laju pengeluaran anggaran error Anda. Bagian ini tidak membahas kebijakan pemberitahuan secara mendetail; bagian ini mengasumsikan bahwa Anda sudah mengetahui konsep dasar kondisi dan saluran notifikasi.

Untuk mengetahui informasi umum tentang kebijakan pemberitahuan dan cara membuatnya, lihat Menggunakan kebijakan pemberitahuan.

Untuk langkah-langkah spesifik dalam membuat kebijakan pemberitahuan berbasis SLO, lihat hal berikut:

Laju penggunaan anggaran error

Anggaran error Anda untuk periode kepatuhan adalah (1 − sasaran SLO) × (peristiwa yang memenuhi syarat dalam periode kepatuhan). Jika sasaran SLO Anda adalah 95%, maka 5% peristiwa yang diukur oleh SLI Anda dapat gagal sebelum sasaran SLO Anda terlewat.

Laju pengeluaran memberi tahu Anda seberapa cepat Anda menghabiskan anggaran error selama periode kepatuhan. Rasio pembakaran bergantung pada jumlah peristiwa yang memenuhi syarat dan jumlah peristiwa error yang diterima dalam periode kepatuhan. Misalnya, jika tidak ada peristiwa error yang terjadi, maka anggaran error tidak akan digunakan dan laju penggunaannya nol. Untuk contoh yang menggambarkan cara menghitung waktu nonaktif maksimum untuk layanan dengan mengasumsikan bahwa semua permintaan gagal, lihat Laju penggunaan SLO.

Metrik laju pengeluaran dinormalisasi sehingga laju pengeluaran yang lebih besar dari satu menunjukkan bahwa jika rasio error yang diukur dipertahankan selama periode kepatuhan mendatang, layanan akan keluar dari SLO untuk periode tersebut. Untuk mengetahui informasi selengkapnya, lihat Anggaran error.

Metrik burn rate diambil oleh pemilih deret waktu select_slo_burn_rate. Kebijakan pemberitahuan tingkat penggunaan akan memberi tahu Anda saat anggaran error Anda digunakan lebih cepat daripada nilai minimum yang Anda tentukan, yang diukur selama periode kepatuhan pemberitahuan. Ada selektor deret waktu lainnya; lihat Mengambil data SLO untuk mengetahui informasi selengkapnya. Anda dapat membuat kebijakan pemberitahuan yang menggunakan beberapa pemilih deret waktu lainnya, tetapi Anda harus membuatnya menggunakan Cloud Monitoring API.

Ringkasan pembuatan kebijakan pemberitahuan pada SLO

Membuat kebijakan pemberitahuan untuk SLO mirip dengan membuat kebijakan pemberitahuan untuk metrik. Bagian ini meninjau langkah-langkah umum untuk membuat kebijakan pemberitahuan.

Untuk membuat kebijakan pemberitahuan untuk SLO, Anda harus melakukan langkah-langkah berikut:

  1. Identifikasi SLO yang ingin dijadikan dasar kebijakan pemberitahuan.

  2. Buat kondisi untuk kebijakan pemberitahuan yang menggunakan SLO yang dipilih. Dalam kondisi, Anda menentukan pemilih deret waktu yang akan digunakan dalam mengambil data SLO. Anda juga menentukan durasi, nilai minimum, dan perbandingan yang menentukan kapan SLO tidak mematuhi kebijakan.

    Misalnya, jika Anda menggunakan pemilih deret waktu untuk laju pengeluaran, data yang diambil mencerminkan laju pengeluaran anggaran error untuk SLO yang dipilih.

    Kondisi ini juga merupakan tempat Anda menentukan nilai minimum dan durasi pelanggaran SLO sebelum memicu pemberitahuan. Misalnya, Anda ingin kecepatan pembakaran lebih tinggi dari kecepatan yang diinginkan selama beberapa periode sebelum memicu pemberitahuan. Nilai untuk "sejumlah jumlah lebih dari" adalah nilai minimum kondisi, dan nilai untuk "sejumlah periode" adalah durasi kondisi.

  3. Identifikasi atau buat saluran notifikasi yang akan digunakan dalam kebijakan pemberitahuan Anda.

  4. Berikan dokumentasi yang menjelaskan kepada pengguna apa yang memicu kebijakan pemberitahuan.

Untuk mengetahui informasi umum tentang kebijakan pemberitahuan dan cara membuatnya, lihat Menggunakan kebijakan pemberitahuan.

Kebijakan pemberitahuan dan periode lihat balik

Saat mengambil data SLO untuk kebijakan pemberitahuan, Anda menentukan ID untuk SLO dan periode lihat balik. Periode lihat balik menentukan rentang waktu ke belakang untuk mengambil data. Yang penting, periode lihat balik juga digunakan sebagai periode kepatuhan untuk menghitung performa SLO dan anggaran error.

Saat ini, Anda tidak dapat membuat pemberitahuan berdasarkan tingkat konsumsi anggaran error SLO menggunakan periode kepatuhan lebih dari 24 jam. Dalam banyak kasus, memperkirakan periode kepatuhan jangka panjang (misalnya, 28 atau 30 hari) dengan periode kurang dari 24 jam sudah cukup untuk tujuan mendeteksi pemadaman dan mendorong respons operasional jangka pendek Anda terhadapnya.

Periode kepatuhan yang lebih singkat akan memberikan deteksi masalah yang lebih cepat, tetapi dengan ketentuan bahwa perubahan besar pada traffic dan rasio error selama sehari dapat menyebabkan pemberitahuan yang terlalu sensitif selama periode traffic rendah. Pertimbangkan untuk menggunakan nilai minimum burn rate yang jauh lebih besar dari 1 untuk mengurangi sensitivitas pemberitahuan selama waktu ini.

Jenis pemberitahuan anggaran error

Saat menyiapkan kebijakan pemberitahuan untuk memantau anggaran error, sebaiknya siapkan dua kebijakan pemberitahuan terkait:

  • Pemberitahuan Penggunaan cepat, yang memperingatkan Anda tentang perubahan besar yang tiba-tiba dalam konsumsi yang, jika tidak diperbaiki, akan segera menghabiskan anggaran error Anda. “Dengan laju ini, kami akan menghabiskan seluruh anggaran error bulanan dalam dua hari!”

    Untuk pemberitahuan pembakaran cepat, gunakan periode lihat balik yang lebih singkat sehingga Anda akan diberi tahu dengan cepat jika kondisi yang berpotensi menimbulkan bencana telah muncul dan berlanjut, meskipun hanya sebentar. Jika benar-benar buruk, Anda tidak ingin menunggu lama untuk menyadarinya.

    Batas untuk tingkat konsumsi yang Anda kirimkan pemberitahuannya di sini jauh lebih tinggi daripada dasar pengukuran ideal untuk periode lihat balik.

  • Pemberitahuan Slow-burn, yang memperingatkan Anda tentang tingkat penggunaan yang, jika tidak diubah, akan menghabiskan anggaran error Anda sebelum akhir periode kepatuhan. Jenis kondisi ini kurang mendesak daripada kondisi pembakaran cepat. “Kami sedikit melampaui target yang ingin kami capai pada bulan ini, tetapi kami belum dalam masalah besar.”

    Untuk pemberitahuan slow burn, gunakan periode lihat balik yang lebih lama untuk meratakan variasi dalam konsumsi jangka pendek.

    Batas yang Anda aktifkan dalam pemberitahuan slow burn lebih tinggi dari performa ideal untuk periode lihat balik, tetapi tidak lebih tinggi secara signifikan. Kebijakan berdasarkan periode lihat balik yang lebih singkat dengan nilai minimum tinggi mungkin menghasilkan terlalu banyak pemberitahuan, meskipun penggunaan jangka panjang menurun. Namun, jika pemakaian tetap sedikit terlalu tinggi selama periode yang lebih lama, pada akhirnya pemakaian akan menghabiskan semua anggaran error Anda.

Langkah berikutnya