Tujuan Tingkat Layanan (SLO) adalah alat inti dalam toolkit pemantauan layanan Google. SLO dapat memberi Anda sinyal ringkas dan minim gangguan mengenai kesehatan layanan Anda secara keseluruhan. Anthos Service Mesh memungkinkan Anda menetapkan SLO untuk layanan Anda, serta memantau dan memberi pemberitahuan terkait layanan Anda terkait SLO tersebut.
Untuk memantau kondisi layanan, Anda harus memahami perilaku mana yang penting bagi layanan tersebut, serta cara mengukur dan mengevaluasi perilaku tersebut. Indikator tingkat layanan (SLI) adalah ukuran kuantitatif dari beberapa aspek layanan. SLI yang umum adalah:
- Latensi: Waktu yang diperlukan untuk menampilkan respons terhadap permintaan, biasanya diukur dalam milidetik (md). Latensi biasanya disajikan sebagai gabungan. Artinya, data mentah dikumpulkan selama jangka waktu tertentu dan dihitung sebagai persentil. Anthos Service Mesh menampilkan grafik Latensi di halaman Metrics untuk setiap layanan Anda. Grafik Latensi menampilkan latensi dari waktu ke waktu, yang dapat membantu Anda menentukan batas latensi atau batas atas untuk layanan.
- Ketersediaan: Frekuensi respons yang berhasil di respons layanan. Ini biasanya ditampilkan sebagai rasio jumlah respons yang berhasil terhadap jumlah total respons. Grafik rasio error di halaman Metrics dapat membantu Anda menentukan ketersediaan setiap layanan.
SLO adalah nilai target untuk tingkat layanan yang diukur dengan SLI. SLO
dapat direpresentasikan sebagai: SLI ≤ upper_bound
atau SLI ≥ lower_bound
. SLO adalah sasaran terukur untuk performa selama periode waktu tertentu. Misalnya, Anda mungkin memiliki persyaratan seperti berikut untuk beberapa layanan Anda:
- Latensi dapat melebihi 300 md hanya untuk 5 persen permintaan selama periode 30 hari yang berkelanjutan.
- Ketersediaan sistem harus mencapai 99% yang diukur selama satu minggu kalender.
Anda dapat menetapkan dan melihat SLO untuk layanan berdasarkan data telemetri di halaman Health. Anda kemudian dapat membuat pemberitahuan di Stackdriver Monitoring untuk memperingatkan Anda jika layanan tidak berperforma seperti yang diharapkan.
Langkah selanjutnya
Pelajari SLO dari Site Reliability Engineering di Google lebih lanjut: