Panoramica degli obiettivi del livello di servizio
Gli obiettivi del livello di servizio (SLO) sono uno strumento di base nel toolkit per il monitoraggio dei servizi Google. Gli SLO possono fornirti un indicatore conciso e con poco rumore sullo stato complessivo dei tuoi servizi. Cloud Service Mesh ti consente di impostare gli SLO per e monitorare e creare avvisi sui servizi in termini di questi SLO.
Per monitorare l'integrità di un servizio, devi comprendere quali comportamenti sono importanti per quel servizio e come misurarli e valutarli. R L'indicatore del livello del servizio (SLI) è una misura quantitativa relativa ad alcuni aspetti completamente gestito di Google Cloud. Gli SLI tipici sono:
- Latenza: il tempo necessario per restituire una risposta a una richiesta, in genere misurato in millisecondi (ms). La latenza viene in genere presentata come aggregata. Vale a dire che i dati non elaborati vengono raccolti in un determinato periodo di tempo e calcolati come percentili. Cloud Service Mesh mostra un grafico di latenza nella pagina Metriche per ciascuno dei tuoi servizi. Il grafico Latenza mostra la latenza nel tempo, che può aiutarti a determinare una soglia di latenza o un limite superiore per un servizio.
- Disponibilità: la frazione di tempo in cui un servizio risponde correttamente. In genere viene presentato come il rapporto tra il numero di risposte riuscite e il numero totale di risposte. Il grafico Percentuale di errori nella pagina Metriche può aiutarti a determinare la disponibilità di ciascun servizio.
Uno SLO è un valore target per un livello di servizio misurato da uno SLI. Un SLO
può essere rappresentato come: SLI ≤ upper_bound
o SLI ≥ lower_bound
. Gli SLO sono
e misurabili per il rendimento in un determinato periodo di tempo. Ad esempio,
prevedono requisiti simili ai seguenti per alcuni servizi:
- La latenza può superare i 300 ms solo nel 5% delle richieste su una Periodo di 30 giorni.
- Il sistema deve avere una disponibilità del 99% misurata su una settimana di calendario.
Puoi impostare e visualizzare gli SLO per i tuoi servizi in base ai relativi dati di telemetria nella Salute. Potrai quindi creare avvisi in Cloud Monitoring per avvisarti se un servizio il rendimento previsto.
Passaggi successivi
Scopri di più sugli SLO di Site Reliability Engineering di Google: