Panoramica degli obiettivi del livello di servizio

Gli obiettivi del livello di servizio (SLO) sono uno strumento fondamentale del toolkit di monitoraggio dei servizi di Google. Gli SLO possono fornirti un indicatore conciso e a basso rumore sullo stato generale dei tuoi servizi. Cloud Service Mesh ti consente di impostare SLO per i servizi e monitorare e creare avvisi sui servizi in termini di SLO.

Per monitorare l'integrità di un servizio, devi comprendere quali sono i comportamenti importanti per il servizio in questione e come misurarli e valutarli. Un indicatore del livello del servizio (SLI) è una misura quantitativa relativa ad alcuni aspetti del servizio. Gli SLI più comuni sono:

  • Latenza: quanto tempo occorre per restituire una risposta a una richiesta, generalmente misurato in millisecondi (ms). La latenza è in genere presentata come un insieme aggregato. In altre parole, i dati non elaborati vengono raccolti in un determinato periodo di tempo e calcolati come percentili. Cloud Service Mesh visualizza un grafico Latenza nella pagina Metriche per ciascuno dei tuoi servizi. Il grafico Latenza mostra la latenza nel tempo, aiutandoti a determinare una soglia di latenza o un limite superiore per un servizio.
  • Disponibilità: la frazione di tempo in cui un servizio risponde correttamente. In genere, viene presentato come rapporto tra il numero di risposte riuscite e il numero totale di risposte. Il grafico della percentuale di errori nella pagina Metriche può aiutarti a determinare la disponibilità di ciascun servizio.

Uno SLO è un valore target per un livello di servizio misurato da uno SLI. Uno SLO può essere rappresentato come: SLI ≤ upper_bound o SLI ≥ lower_bound. Gli SLO sono obiettivi misurabili per le prestazioni in un determinato periodo di tempo. Ad esempio, per alcuni dei tuoi servizi potrebbero essere previsti requisiti simili ai seguenti:

  • La latenza può superare i 300 ms solo nel 5% delle richieste in un periodo continua di 30 giorni.
  • Il sistema deve avere una disponibilità del 99% misurata in una settimana di calendario.

Puoi impostare e visualizzare gli SLO per i tuoi servizi in base ai relativi dati di telemetria nella pagina Integrità. In seguito, potrai creare avvisi in Cloud Monitoring per ricevere un avviso se un servizio non funziona come previsto.

Passaggi successivi