Panoramica degli obiettivi del livello di servizio
Gli obiettivi del livello di servizio (SLO) sono uno strumento di base nel toolkit per il monitoraggio dei servizi Google. Gli SLO possono fornirti un indicatore conciso e con poco rumore sullo stato complessivo dei tuoi servizi. Cloud Service Mesh ti consente di impostare gli SLO per i tuoi servizi, nonché di monitorarli e inviare avvisi in base a questi SLO.
Per monitorare lo stato di un servizio, devi capire quali sono i comportamenti importanti per quel servizio e come misurarli e valutarli. Un indicatore del livello del servizio (SLI) è una misura quantitativa di alcuni aspetti del servizio. Gli SLI tipici sono:
- Latenza: il tempo necessario per restituire una risposta a una richiesta, in genere misurato in millisecondi (ms). La latenza viene in genere presentata come aggregata. ovvero, i dati non elaborati vengono raccolti in un periodo di tempo e calcolati come percentile. Cloud Service Mesh mostra un grafico di latenza nella pagina Metriche per ciascuno dei tuoi servizi. Il grafico Latenza mostra la latenza nel tempo, che può aiutarti a determinare una soglia di latenza o un limite superiore per un servizio.
- Disponibilità: la frazione di tempo in cui un servizio risponde correttamente. In genere viene presentato come il rapporto tra il numero di risposte riuscite e il numero totale di risposte. Il grafico Percentuale di errori nella pagina Metriche può aiutarti a determinare la disponibilità di ciascun servizio.
Uno SLO è un valore target per un livello di servizio misurato da uno SLI. Un SLO
può essere rappresentato come: SLI ≤ upper_bound
o SLI ≥ lower_bound
. Gli SLO sono obiettivi misurabili per le prestazioni in un determinato periodo di tempo. Ad esempio, potresti avere requisiti come i seguenti per alcuni dei tuoi servizi:
- La latenza può superare i 300 ms solo nel 5% delle richieste in un periodo continuativo di 30 giorni.
- Il sistema deve avere una disponibilità del 99% misurata su una settimana di calendario.
Puoi impostare e visualizzare gli SLO per i tuoi servizi in base ai relativi dati di telemetria nella pagina Integrità. Puoi quindi creare avvisi in Cloud Monitoring per ricevere una notifica se il funzionamento di un servizio non è come previsto.
Passaggi successivi
Scopri di più sugli SLO dal team Site Reliability Engineering di Google: