Panoramica degli avvisi

Questo documento descrive come puoi ricevere notifiche quando la tua applicazione non riesce o quando le prestazioni di un'applicazione non soddisfano i criteri definiti.

Come funzionano gli avvisi

Il processo di avviso di Cloud Monitoring è composto da tre parti:

  • Un criterio di avviso, che descrive le circostanze in cui vuoi ricevere avvisi e come vuoi ricevere notifiche su un incidente. Il criterio di avviso può monitorare i dati delle serie temporali archiviati da Monitoring o i log archiviati da Cloud Logging. Quando i dati soddisfano la condizione del criterio di avviso, Monitoring crea un incidente e invia le notifiche.

  • Ogni incidente è un record del tipo di dati monitorati e del momento in cui le condizioni sono state soddisfatte. Queste informazioni possono aiutarti a risolvere i problemi che hanno causato l'incidente.

  • Un canale di notifica definisce il modo in cui ricevi le notifiche quando Monitoring crea un incidente. Ad esempio, puoi configurare un canale di notifica per inviare un'email a my-support-team@example.com e pubblicare un messaggio Slack sul canale #my-support-team. Un criterio di avviso può contenere uno o più canali di notifica.

I criteri di avviso possono valutare due tipi di dati:

  • I dati delle serie temporali, detti anche dati delle metriche, che vengono archiviati da Monitoring. Questi tipi di criteri sono chiamati criteri di avviso basati sulle metriche.

    Per scoprire come configurare un criterio di avviso basato su metriche, consulta la Guida rapida per Compute Engine.

  • Dati di log archiviati da Cloud Logging. Questi tipi di criteri sono chiamati criteri di avviso basati su log. I criteri di avviso basati su log ti informano quando nei log viene visualizzato un determinato messaggio.

    Questo documento si concentra sui criteri di avviso basati su metriche, con informazioni generali sui criteri di avviso basati su log, se pertinenti. Per informazioni dettagliate sui criteri di avviso basati su log, consulta Monitorare i log.

Il processo di avviso consente di rispondere ai problemi quando le prestazioni di un'applicazione non soddisfano i valori accettabili. Ad esempio, esegui il deployment di un'applicazione web su un'istanza di una macchina virtuale (VM) Compute Engine. Anche se prevedi che la latenza di risposta HTTP fluttua, è consigliabile che il team di assistenza risponda quando l'applicazione presenta un'elevata latenza per un periodo di tempo significativo. Potresti creare un criterio di avviso basato sulle metriche per monitorare la metrica di latenza della risposta HTTP dell'applicazione. Se la latenza di risposta è superiore a due secondi per almeno cinque minuti, Monitoring crea un incidente e invia notifiche via email al team di assistenza.

Come creare un criterio di avviso

Esistono diversi modi per creare un criterio di avviso. Ad esempio, puoi utilizzare criteri di avviso preconfigurati attivando gli avvisi consigliati dalle integrazioni o da determinate pagine nella console Google Cloud. Puoi anche configurare un nuovo criterio di avviso utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI e Terraform.

Utilizza le integrazioni e i criteri di avviso consigliati

Monitoring offre pacchetti predefiniti per consentirti di creare criteri di avviso per i servizi Google Cloud e le integrazioni di terze parti. I pacchetti includono criteri di avviso consigliati, dashboard di esempio e metriche chiave per il servizio. Questi pacchetti sono disponibili per i servizi Google Cloud come Google Kubernetes Engine, Compute Engine e Cloud SQL, nonché per le integrazioni di terze parti comuni come MongoDB, Kafka ed Elasticsearch.

Quando installi un pacchetto, puoi abilitare i criteri di avviso consigliati per il pacchetto. Quando attivi un criterio di avviso consigliato, configuri il relativo canale di notifica e, facoltativamente, modifichi altri valori. Dopo la configurazione, il criterio di avviso inizia immediatamente a monitorare la destinazione, senza ulteriori input utente.

I criteri di avviso consigliati sono utili se hai eseguito il deployment di un nuovo servizio e vuoi creare avvisi su metriche importanti. Ad esempio, il pacchetto di integrazione Cloud SQL include criteri di avviso consigliati per le istanze non riuscite e le transazioni lente:

Due dei criteri di avviso consigliati per il pacchetto di integrazione Cloud SQL.

Per maggiori informazioni sulle integrazioni degli avvisi, consulta Monitorare le applicazioni di terze parti.

Usa Cloud Monitoring

Se vuoi creare un criterio di avviso e scegliere il tipo di condizione insieme ad altri componenti, come il tipo di metrica e le serie temporali, utilizza Monitoring. La tabella seguente elenca i diversi tipi di condizioni che puoi utilizzare quando crei un criterio di avviso.

Tipo di condizione Descrizione Esempio
Condizione soglia metrica

Le condizioni di soglia della metrica vengono soddisfatte quando i valori di una metrica sono maggiori o minori di una soglia per una finestra di test specifica.

Per maggiori informazioni, consulta Creare criteri di avviso con soglia di metrica e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che invii una notifica quando la latenza della risposta è pari o superiore a 500 ms per cinque controlli di uptime consecutivi nell'arco di 10 minuti.
Condizione di assenza metrica

Le condizioni di assenza metrica vengono soddisfatte quando una serie temporale monitorata non ha dati per una finestra di test specifica. La finestra massima per il nuovo test è di 23,5 ore.

Per maggiori informazioni, consulta Creare criteri di avviso per l'assenza di metriche e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che apra un incidente con il tuo team di assistenza quando una risorsa non risponde a nessuna richiesta HTTP nell'arco di cinque minuti.
Condizione valore metrica-valore prevista

Le condizioni valore metrica previste vengono soddisfatte quando il criterio di avviso prevede che la soglia verrà violata nella finestra di previsione successiva. La finestra di previsione può variare da 1 ora a 7 giorni.

Per maggiori informazioni, consulta Creare criteri di avviso previsti per il valore della metrica e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che apra un incidente con il tuo team di assistenza quando è probabile che una risorsa raggiunga l'80% di utilizzo dello spazio su disco entro le prossime 24 ore.
Condizione basata su log

Una condizione di un criterio di avviso basato su log viene soddisfatta quando il criterio di avviso rileva che una metrica basata su log corrisponde ai criteri del criterio di avviso. Le metriche basate su log ricavano i dati delle metriche dal contenuto delle voci di log. Ad esempio, puoi utilizzare una metrica basata su log per contare il numero di voci di log che contengono un determinato messaggio o per estrarre le informazioni sulla latenza registrate nelle voci di log.

Per ulteriori informazioni, consulta Configurare i criteri di avviso basati su log e Creare un criterio di avviso basato su log utilizzando l'API Cloud Monitoring.

Vuoi un criterio di avviso che apra un incidente con il team di assistenza quando il progetto ha almeno 50 voci di log con un message che contiene product_ids=['tier_1_support', 'tier_2_support']

Componenti dei criteri di avviso

Ogni criterio di avviso include i seguenti componenti:

  • Una condizione che descrive quando una risorsa o un gruppo di risorse si trova in uno stato che richiede una risposta. La condizione include l'origine dati, una soglia statica o dinamica e metodi di aggregazione dei dati come filtri e groupby. Le condizioni possono monitorare una singola metrica, più metriche o un rapporto di metriche. Puoi anche utilizzare linguaggi di query come PromQL e Monitoring Query Language (MQL) per includere espressioni complesse come soglie dinamiche e logica condizionale.

    Se utilizzi un'integrazione per abilitare un criterio di avviso consigliato, la condizione del criterio di avviso viene precompilata.

  • Un elenco di canali di notifica che descrive a chi inviare notifiche quando è richiesta un'azione. Per maggiori informazioni, consulta Creare e gestire canali di notifica.

  • Documentazione visualizzata nelle pagine delle notifiche e degli incidenti. Puoi configurare la riga dell'oggetto di una notifica e aggiungere informazioni utili al corpo della notifica. Ad esempio, potresti configurare la notifica in modo da visualizzare link a playbook interni o a pagine Google Cloud come dashboard personalizzate. Per ulteriori informazioni sulla documentazione, inclusi gli esempi, consulta Annotare gli incidenti con la documentazione definita dall'utente.

Linguaggio per le query

Utilizza linguaggi di query e filtri nei criteri di avviso per avere un maggiore controllo sulla valutazione delle metriche. Monitoring supporta i seguenti tipi di query:

  • Prometheus Query Language (PromQL) è un linguaggio di query funzionale utilizzato per valutare i dati di serie temporali in tempo reale. Puoi configurare le condizioni criterio di avviso per includere una query PromQL nelle relative condizioni. Le query PromQL possono utilizzare qualsiasi espressione valida, come combinazioni di metriche, rapporti e soglie di scalabilità. Configurando i criteri di avviso con una condizione basata su PromQL in Google Cloud, puoi ridurre le dipendenze dall'infrastruttura di avviso esterna. Per ulteriori informazioni, consulta PromQL in Cloud Monitoring e Criteri di avviso con PromQL.

  • Monitoring Query Language (MQL) è un'interfaccia espressiva basata su testo che consente di recuperare, filtrare e manipolare i dati delle serie temporali. Puoi creare criteri di avviso con condizioni che includono un'operazione di avviso in Monitoring Query Language. Per maggiori informazioni, consulta Panoramica di Monitoring Query Language e Criteri di avviso con MQL.

  • I filtri di monitoraggio consentono di configurare criteri di avviso in modo da usare rapporti delle metriche basate su filtri. I criteri di avviso basati su filtri non possono essere visualizzati o modificati nella console Google Cloud. Per un esempio di criterio che utilizza i filtri di Monitoring, consulta Rapporto delle metriche.

Gestisci criteri di avviso e incidenti

Dopo l'abilitazione di un criterio di avviso, Monitoring monitora continuamente le condizioni del criterio. Non puoi configurare il criterio di avviso per monitorare le condizioni solo per determinati periodi di tempo. Se vuoi disabilitare il criterio di avviso per un determinato periodo di tempo, crea una posticipazione.

Se un incidente è aperto e Monitoring determina che le condizioni del criterio basato su metriche non sono più soddisfatte, Monitoring chiude automaticamente l'incidente e invia una notifica relativa alla chiusura.

Prezzi

In generale, le metriche di sistema di Cloud Monitoring sono gratuite, mentre quelle di sistemi, agenti o applicazioni esterni non lo sono. Le metriche fatturabili vengono fatturate in base al numero di byte o al numero di campioni importati.

Per ulteriori informazioni sui prezzi di Cloud Monitoring, consulta i seguenti documenti:

Per informazioni su come monitorare il numero di intervalli di traccia o di log importati o su come ricevere notifiche quando in una voce di log sono inclusi contenuti specifici, consulta i seguenti documenti:

Passaggi successivi