Ringkasan tujuan tingkat layanan
Tujuan Tingkat Layanan (SLO) adalah alat inti dalam toolkit pemantauan layanan Google. SLO dapat memberi Anda sinyal ringkas dan minim derau terkait kondisi layanan Anda secara keseluruhan. Cloud Service Mesh memungkinkan Anda menetapkan SLO untuk layanan, serta memantau dan memberikan pemberitahuan tentang layanan berdasarkan SLO tersebut.
Untuk memantau kondisi layanan, Anda perlu memahami perilaku mana yang penting untuk layanan tersebut dan cara mengukur serta mengevaluasi perilaku tersebut. Indikator tingkat layanan (SLI) adalah ukuran kuantitatif dari beberapa aspek layanan. SLI standar adalah:
- Latensi: Durasi waktu yang diperlukan untuk menampilkan respons terhadap permintaan, biasanya diukur dalam milidetik (md). Latensi biasanya ditampilkan sebagai gabungan. Artinya, data mentah dikumpulkan selama jangka waktu tertentu dan dihitung sebagai persentil. Cloud Service Mesh menampilkan grafik Latensi di halaman Metrik untuk setiap layanan Anda. Grafik Latensi menunjukkan latensi dari waktu ke waktu, yang dapat membantu Anda menentukan nilai minimum latensi atau batas atas untuk layanan.
- Ketersediaan: Persentase waktu saat layanan berhasil merespons. Metrik ini biasanya ditampilkan sebagai rasio jumlah respons yang berhasil terhadap total jumlah respons. Grafik Tingkat error di halaman Metrik dapat membantu Anda menentukan ketersediaan setiap layanan.
SLO adalah nilai target untuk tingkat layanan yang diukur dengan SLI. SLO
dapat direpresentasikan sebagai: SLI ≤ upper_bound
atau SLI ≥ lower_bound
. SLO adalah
sasaran terukur untuk performa selama jangka waktu tertentu. Misalnya, Anda mungkin
memiliki persyaratan seperti berikut untuk beberapa layanan:
- Latensi dapat melebihi 300 md hanya dalam 5 persen permintaan selama periode 30 hari bergulir.
- Sistem harus memiliki ketersediaan 99% yang diukur selama satu minggu kalender.
Anda dapat menetapkan dan melihat SLO untuk layanan berdasarkan data telemetrinya di halaman Health. Kemudian, Anda dapat membuat pemberitahuan di Cloud Monitoring untuk memperingatkan Anda jika layanan tidak berperforma seperti yang diharapkan.
Langkah selanjutnya
Pelajari SLO lebih lanjut dari Site Reliability Engineering di Google: