Panoramica degli obiettivi del livello di servizio
Gli obiettivi del livello di servizio (SLO) sono uno strumento di base nel toolkit per il monitoraggio dei servizi Google. Gli SLO possono fornire un segnale conciso e a basso rumore per quanto riguarda stato dei servizi. Cloud Service Mesh ti consente di impostare gli SLO per e monitorare e creare avvisi sui servizi in termini di questi SLO.
Per monitorare lo stato di un servizio, devi capire quali sono i comportamenti importanti per quel servizio e come misurarli e valutarli. Un indicatore del livello del servizio (SLI) è una misura quantitativa di alcuni aspetti del servizio. Gli SLI più comuni sono:
- Latenza: quanto tempo occorre per restituire una risposta a una richiesta, solitamente misurata in millisecondi (ms). La latenza è in genere presentata come un insieme aggregato. In altre parole, i dati non elaborati vengono raccolti in un periodo di tempo e calcolati come percentile. Cloud Service Mesh mostra un grafico di latenza nella pagina Metriche per ciascuno dei tuoi servizi. Il grafico Latenza mostra la latenza nel tempo, che può aiutarti a determinare una soglia di latenza o un limite superiore per un servizio.
- Disponibilità: la frazione di tempo in cui un servizio risponde correttamente. In genere viene presentato come il rapporto tra il numero di risposte riuscite e il numero totale di risposte. Grafico del tasso di errori in Metriche pagina può aiutarti a determinare la disponibilità di ciascun servizio.
Uno SLO è un valore target per un livello di servizio misurato da uno SLI. Un SLO
può essere rappresentato come: SLI ≤ upper_bound
o SLI ≥ lower_bound
. Gli SLO sono
e misurabili per il rendimento in un determinato periodo di tempo. Ad esempio,
prevedono requisiti simili ai seguenti per alcuni servizi:
- La latenza può superare i 300 ms solo nel 5% delle richieste su una Periodo di 30 giorni.
- Il sistema deve avere una disponibilità del 99% misurata in una settimana di calendario.
Puoi impostare e visualizzare gli SLO per i tuoi servizi in base ai relativi dati di telemetria nella Salute. Potrai quindi creare avvisi in Cloud Monitoring per avvisarti se un servizio il rendimento previsto.
Passaggi successivi
Scopri di più sugli SLO dal team Site Reliability Engineering di Google: