Panoramica degli obiettivi del livello di servizio
Gli obiettivi del livello di servizio (SLO) sono uno strumento fondamentale per il monitoraggio il toolkit. Gli SLO possono fornire un segnale conciso e a basso rumore per quanto riguarda stato dei servizi. Cloud Service Mesh ti consente di impostare SLO per i tuoi servizi per monitorare e creare avvisi sui tuoi servizi in termini di questi SLO.
Per monitorare lo stato di un servizio, devi capire quali sono i comportamenti importanti per quel servizio e come misurarli e valutarli. R L'indicatore del livello del servizio (SLI) è una misura quantitativa relativa ad alcuni aspetti completamente gestito di Google Cloud. Gli SLI più comuni sono:
- Latenza: il tempo necessario per restituire una risposta a una richiesta, in genere misurato in millisecondi (ms). La latenza viene in genere presentata come aggregata. Vale a dire che i dati non elaborati vengono raccolti in un determinato periodo di tempo e calcolati come percentili. Cloud Service Mesh visualizza un grafico Latenza nella pagina Metriche per ciascuno dei tuoi servizi. Il grafico Latenza mostra la latenza nel tempo, che può aiutarti a determinare una soglia di latenza o un limite superiore per un servizio.
- Disponibilità: la frazione di tempo in cui un servizio risponde correttamente. Viene generalmente presentato come rapporto tra il numero di risposte positive rispetto al numero totale di risposte. Grafico del tasso di errori in Metriche pagina può aiutarti a determinare la disponibilità di ciascun servizio.
Uno SLO è un valore target per un livello di servizio misurato da uno SLI. Un SLO
può essere rappresentato come: SLI ≤ upper_bound
o SLI ≥ lower_bound
. Gli SLO sono
e misurabili per il rendimento in un determinato periodo di tempo. Ad esempio, potresti avere requisiti come i seguenti per alcuni dei tuoi servizi:
- La latenza può superare i 300 ms solo nel 5% delle richieste su una Periodo di 30 giorni.
- Il sistema deve avere una disponibilità del 99% misurata in una settimana di calendario.
Puoi impostare e visualizzare gli SLO per i tuoi servizi in base ai relativi dati di telemetria nella Salute. Potrai quindi creare avvisi in Cloud Monitoring per avvisarti se un servizio il rendimento previsto.
Passaggi successivi
Scopri di più sugli SLO dal team Site Reliability Engineering di Google: