Puoi creare criteri di avviso per gli obiettivi del livello di servizio (SLO) per informarti se rischi di violare uno SLO. Seleziona lo SLO che vuoi monitorare e poi configura un criterio di avviso per monitorarlo. La condizione viene in genere espressa selezionando un valore di soglia che costituisce una violazione e un periodo per il quale la violazione è consentita. Se la soglia viene superata per più del periodo consentito, viene attivata la norma di avviso.
Questa pagina descrive gli avvisi sulla velocità di consumo del budget di errore. Non tratta i criteri di avviso in dettaglio; presuppone che tu conosca già i concetti di base delle condizioni e dei canali di notifica.
Per informazioni generali sui criteri di avviso e su come crearli, consulta Utilizzare i criteri di avviso.
Per la procedura dettagliata per la creazione di un criterio di avviso basato su SLO, consulta quanto segue:
- Creazione di un criterio di avviso utilizzando la console Google Cloud.
- Creazione di un criterio di avviso utilizzando l'API Cloud Monitoring.
Burn rate del budget di errore
Il budget di errore per un periodo di conformità è (1 - obiettivo SLO) × (eventi idonei nel periodo di conformità). Se il tuo obiettivo SLO è del 95%, è accettabile che il 5% degli eventi misurati dall'SLI non vada a buon fine prima che venga mancato l'obiettivo SLO.
La tasso di burn indica la velocità con cui consumi il budget di errore per un periodo di conformità. Il tasso di burn dipende dal numero di eventi idonei e dal numero di eventi di errore ricevuti nel periodo di conformità. Ad esempio, se non si verificano eventi di errore, il budget di errore non viene consumato e il tasso di utilizzo è pari a zero. Per un esempio che illustra come calcolare il tempo di inattività massimo per un servizio assumendo che tutte le richieste non vadano a buon fine, consulta Tasso di burn dello SLO.
La metrica del tasso di utilizzo è normalizzata in modo che un tasso di utilizzo superiore a 1 indichi che, se la percentuale di errori misurata viene mantenuta in un periodo di conformità futuro, il servizio non sarà conforme allo SLO per quel periodo. Per ulteriori informazioni, consulta Budget di errori.
La metrica di burn rate viene recuperata dal selettore delle serie temporali
select_slo_burn_rate
. Un criterio di avviso sul burn rate ti avvisa quando il budget di errore viene consumato più velocemente di una soglia che hai definito, misurata nel periodo di conformità dell'avviso. Esistono altri selettori delle serie temporali. Per ulteriori informazioni, consulta Recupero dei dati SLO.
Puoi creare criteri di avviso che utilizzano alcuni di questi altri selettori di serie temporali, ma devi crearli utilizzando l'API Cloud Monitoring.
Panoramica della creazione di un criterio di avviso su uno SLO
La creazione di un criterio di avviso per uno SLO è simile alla creazione di un criterio di avviso per le metriche. Questa sezione illustra i passaggi generali per creare un criterio di avviso.
Per creare un criterio di avviso per uno SLO, segui questi passaggi:
Identifica lo SLO su cui vuoi basare il criterio di avviso.
Costruisci una condizione per il criterio di avviso che utilizzi lo SLO scelto. Nella condizione, specifica un selettore di serie temporali da utilizzare per recuperare i dati SLO. Specifica anche una durata, una soglia e un confronto che determinano quando lo SLO non è conforme.
Ad esempio, se utilizzi il selettore delle serie temporali per la burn rate, i dati recuperati riflettono la burn rate del budget di errore per lo SLO scelto.
La condizione è anche dove specifichi la soglia e la durata delle violazioni dello SLO prima di attivare un avviso. Ad esempio, vuoi che il burn rate sia superiore al tasso desiderato per un certo periodo prima di attivare un avviso. Il valore di "quantità superiore a" è la soglia della condizione e il valore di "periodo" è la durata della condizione.
Identifica o crea un canale di notifica da utilizzare nel criterio di avviso.
Fornisci la documentazione che spiega agli utenti cosa ha attivato il criterio di avviso.
Per informazioni generali sui criteri di avviso e su come crearli, consulta Utilizzare i criteri di avviso.
Criteri di avviso e periodi di riferimento
Quando recuperi i dati SLO per un criterio di avviso, specifica un identificatore per lo SLO e un periodo di riferimento. Il periodo di riferimento determina quanto indietro nel tempo è possibile recuperare i dati. È fondamentale sottolineare che il periodo di riferimento viene utilizzato anche come periodo di conformità per il calcolo del rendimento e del budget di errore dello SLO.
Al momento non è possibile basare gli avvisi sul tasso di consumo del budget di errore di uno SLO utilizzando un periodo di conformità superiore a 24 ore. In molti casi, è sufficiente approssimare il periodo di conformità a lungo termine (ad esempio 28 o 30 giorni) con uno inferiore a 24 ore per rilevare le interruzioni e adottare una risposta operativa a breve termine.
Periodi di conformità più brevi consentono di rilevare i problemi più rapidamente; tuttavia, tieni presente che variazioni importanti del traffico e dei tassi di errore nel corso di una giornata potrebbero causare un'attivazione eccessivamente sensibile degli avvisi durante i periodi di traffico ridotto. Valuta la possibilità di utilizzare una soglia di burn rate notevolmente superiore a 1 per ridurre la sensibilità degli avvisi durante questi periodi.
Tipi di avvisi relativi al budget di errore
Quando configuri i criteri di avviso per monitorare il budget di errore, è buona prassi impostare due criteri di avviso correlati:
Avviso Fast-burn, che ti avvisa di una variazione improvvisa e significativa del consumo che, se non corretta, esaurirà molto presto il tuo budget di errore. "A questo ritmo, consumeremo il budget di errore di tutto il mese in due giorni."
Per un avviso fast-burn, utilizza un periodo di ricerca più breve in modo da ricevere una notifica rapida se è emersa una condizione potenzialmente catastrofica e persiste, anche brevemente. Se è davvero disastroso, non conviene aspettare a lungo prima di notarlo.
La soglia per il tasso di consumo che segnali qui è molto più elevata rispetto al valore di riferimento ideale per il periodo di riferimento.
Avviso Slow-burn, che ti avvisa di un tasso di consumo che, se non modificato, esaurirà il budget di errore prima della fine del periodo di conformità. Questo tipo di condizione è meno urgente di una condizione fast-burn. "Stiamo leggermente superando i livelli che vorremmo avere raggiunto a questo punto del mese, ma non abbiamo ancora grossi problemi."
Per un avviso di tipo slow-burn, utilizza un periodo di tempo più lungo per uniformare le variazioni del consumo a breve termine.
La soglia per la quale viene attivato un avviso con graduale applicazione è superiore al rendimento ideale per il periodo di riferimento, ma non in modo significativo. Un criterio basato su un periodo di tempo più breve con una soglia elevata potrebbe generare troppi avvisi, anche se il consumo a lungo termine si stabilizza. Tuttavia, se il consumo rimane anche un po' troppo alto per un periodo più lungo, alla fine esaurirà tutto il budget di errore.
Passaggi successivi
- Per creare un criterio di avviso basato su SLO utilizzando la console Google Cloud, consulta Creare un criterio di avviso (console Google Cloud).
- Per creare un criterio di avviso basato su SLO utilizzando l'API Monitoring, consulta Creazione di un criterio di avviso (API).