Panoramica degli avvisi

Questo documento descrive come ricevere una notifica quando l'applicazione non funziona o quando le prestazioni di un'applicazione non soddisfano i criteri definiti.

Come funzionano gli avvisi

La procedura di invio di avvisi di Cloud Monitoring è composta da tre parti:

  • Un criterio di avviso, che descrive le circostanze in cui vuoi ricevere un avviso e la modalità di notifica di un incidente. Il criterio di avviso può monitorare i dati delle serie temporali archiviati da Monitoring o i log archiviati da Cloud Logging. Quando questi dati soddisfano la condizione del criterio di avviso, il monitoraggio crea un incidente e invia le notifiche.

  • Ogni incidente è un record del tipo di dati monitorati e del momento in cui sono state soddisfatte le condizioni. Queste informazioni possono aiutarti a risolvere i problemi che hanno causato l'incidente.

  • Un canale di notifica definisce la modalità di ricezione delle notifiche quando il monitoraggio crea un incidente. Ad esempio, puoi configurare un canale di notifica per inviare un'email all'indirizzo my-support-team@example.com e pubblicare un messaggio di Slack nel canale #my-support-team. Un criterio di avviso può contenere uno o più canali di notifica.

I criteri di avviso possono valutare tre tipi di dati:

  • Dati delle serie temporali, chiamati anche dati delle metriche, archiviati da monitoraggio. Questi tipi di criteri sono chiamati criteri di avviso basati su metriche.

    Per scoprire come configurare un criterio di avviso basato su metriche, prova la guida introduttiva per Compute Engine.

  • Dati delle voci di log archiviati da Cloud Logging. I criteri di avviso che valutano le singole voci di log sono chiamati basati su log. I criteri di avviso basati su log ti informano quando viene visualizzato un determinato messaggio nei log. Per ulteriori informazioni, consulta Monitorare i log.

  • I risultati di una query SQL eseguita in Analisi dei log in base ai dati voce di log archiviati in Logging. I criteri di avviso che monitorano i risultati di una query SQL sono chiamati criteri di avviso basati su SQL. Per ulteriori informazioni, consulta Monitorare i risultati delle query SQL con un criterio di avviso.

    I criteri di avviso basati su SQL sono in anteprima pubblica.

La procedura di invio di avvisi ti aiuta a rispondere ai problemi quando il rendimento di un'applicazione non raggiunge valori accettabili. Ad esempio, esegui il deployment di un'applicazione web su un'istanza di macchina virtuale (VM) Compute Engine. Anche se prevedi che la latenza della risposta HTTP oscilli, vuoi che il team di assistenza risponda quando l'applicazione presenta una latenza elevata per un periodo di tempo significativo. Puoi creare un criterio di avviso basato su metriche che monitora la metrica della latenza della risposta HTTP dell'applicazione. Se la latenza di risposta è superiore a due secondi per almeno cinque minuti, il monitoraggio crea un incidente e invia notifiche via email al team di assistenza.

Come creare un criterio di avviso

Esistono diversi modi per creare un criterio di avviso. Ad esempio, puoi utilizzare i criteri di avviso preconfigurati attivando gli avvisi consigliati dalle integrazioni o da determinate pagine della console Google Cloud. Puoi anche configurare un nuovo criterio di avviso utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI e Terraform.

Utilizzare le integrazioni e i criteri di avviso consigliati

Monitoring fornisce pacchetti predefiniti per consentirti di creare criteri di avviso per i tuoi servizi Google Cloud e le integrazioni di terze parti. I pacchetti includono criteri di avviso consigliati, dashboard di esempio e metriche chiave per il servizio. Questi pacchetti sono disponibili per i servizi Google Cloud come Google Kubernetes Engine, Compute Engine e Cloud SQL e per le integrazioni di terze parti comuni come MongoDB, Kafka ed Elasticsearch.

Quando installi un pacchetto, puoi attivare le norme di avviso consigliate del pacchetto. Quando attivi un criterio di avviso consigliato, configuri il relativo canale di notifica e, facoltativamente, modifichi altri valori. Dopo la configurazione, il criterio di avviso inizia a monitorare immediatamente il proprio target, senza richiedere ulteriore input utente dell'utente.

I criteri di avviso consigliati sono utili quando hai implementato un nuovo servizio e vuoi ricevere avvisi su metriche importanti. Ad esempio, il pacchetto di integrazione Cloud SQL include criteri di avviso consigliati per le istanze non riuscite e le transazioni lente:

Due dei criteri di avviso consigliati per il pacchetto di integrazione Cloud SQL.

Per ulteriori informazioni sulle integrazioni degli avvisi, consulta Monitoraggio delle applicazioni di terze parti.

Creare nuovi criteri di avviso

Puoi creare criteri di avviso per monitorare diversi tipi di dati in base alle tue esigenze. Nelle sezioni seguenti sono elencati i diversi tipi di dati che puoi monitorare con i criteri di avviso.

Monitorare i dati delle serie temporali

Tipo di condizione Descrizione Esempio
Condizione di soglia metrica

Le condizioni di soglia metrica vengono soddisfatte quando i valori di una metrica sono superiori o inferiori a una soglia per una finestra di riesami specifica.

Per saperne di più, consulta Creare criteri di avviso basati su soglie di metriche e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che invii una notifica quando la latenza della risposta è pari o superiore a 500 ms per cinque controlli dell'uptime consecutivi in 10 minuti.
Condizione di assenza di metriche

Le condizioni di assenza di metriche sono soddisfatte quando una serie temporale monitorata non ha dati per un determinato periodo di riesami. La finestra di riesami massima è di 23,5 ore.

Per saperne di più, consulta Creare criteri di avviso per l'assenza di metriche e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che apra un incidente con il tuo team di assistenza quando una risorsa non risponde a richieste HTTP nel corso di cinque minuti.
Condizione del valore della metrica previsto

Le condizioni dei valori delle metriche previste sono soddisfatte quando il criterio di avviso prevede che la soglia verrà violata nell'imminente finestra di previsione. La finestra di previsione può variare da 1 ora a 7 giorni.

Per saperne di più, consulta Creare criteri di avviso per i valori delle metriche previsti e Creare criteri di avviso utilizzando l'API.

Vuoi un criterio di avviso che apra un incidente con il tuo team di assistenza quando è probabile che una risorsa raggiunga l'80% di utilizzo dello spazio su disco nelle prossime 24 ore.

Monitorare i dati voce di log

Per monitorare le singole voci di log, utilizza un criterio di avviso basato su log. Una condizione in un criterio di avviso basato su log viene soddisfatta quando il criterio di avviso rileva che una frase di una voce di log corrisponde ai criteri del criterio di avviso. Ad esempio, vuoi un criterio di avviso che apra un incidente con il tuo team di assistenza quando message di una voce di log contiene product_ids=['tier_1_support', 'tier_2_support'].

Per ulteriori informazioni, consulta la sezione Configurare i criteri di avviso basati su log nella documentazione relativa alla registrazione.

Monitorare i risultati delle query SQL

Per monitorare i risultati delle query SQL, utilizza un criterio di avviso basato su SQL. La condizione di un criterio di avviso basato su SQL analizza periodicamente i dati voce di log e poi crea gli incidenti quando la tabella dei risultati delle query soddisfa determinati criteri. Questo tipo di criterio di avviso è utile quando hai bisogno di un criterio di avviso che monitori aggregazioni di dati o pattern complessi in più voci di log. Ad esempio, vuoi ricevere una notifica quando più di 50 voci di log negli ultimi 60 minuti hanno una gravità pari a WARNING.

Per ulteriori informazioni, consulta Monitorare i risultati delle query SQL con un criterio di avviso nella documentazione relativa alla registrazione.

Componenti dei criteri di avviso

Ogni criterio di avviso è composto dai seguenti componenti:

  • Una condizione che descrive quando una risorsa o un gruppo di risorse è in uno stato che richiede una risposta. La condizione include l'origine dati, una soglia statica o dinamica e metodi di aggregazione dei dati come filtri e raggruppamento. Le condizioni possono monitorare una singola metrica, più metriche o un rapporto tra metriche. Puoi anche utilizzare il linguaggio di query Prometheus (PromQL) per includere espressioni complesse come soglie dinamiche e logica condizionale.

    Se utilizzi un'integrazione per attivare un criterio di avviso consigliato, la condizione del criterio di avviso viene precompilata.

  • Un elenco di canali di notifica che descrivono chi deve essere informato quando è necessaria un'azione. Per saperne di più, consulta la pagina Creare e gestire i canali di notifica.

  • Documentazione visualizzata nelle notifiche e nelle pagine degli incidenti. Puoi configurare l'oggetto di una notifica e aggiungere informazioni utili al corpo della notifica. Ad esempio, potresti configurare la notifica in modo da visualizzare i link ai playbook interni o alle pagine di Google Cloud, come le dashboard personalizzate. Per saperne di più sulla documentazione, inclusi esempi, consulta Annotare gli incidenti con la documentazione definita dall'utente.

Lingue di query

Utilizza i linguaggi di query e i filtri nei tuoi criteri di avviso per avere un maggiore controllo sulla valutazione delle metriche. Il monitoraggio supporta i seguenti tipi di query:

  • Prometheus Query Language (PromQL) è un linguaggio di query funzionale utilizzato per valutare i dati delle serie temporali in tempo reale. Puoi configurare i criteri di avviso in modo da includere una query PromQL nelle relative condizioni. Le query PromQL possono utilizzare qualsiasi expression valida, ad esempio combinazioni di metriche, rapporti e soglie di scalabilità. Configurando i criteri di avviso con una condizione basata su PromQL in Google Cloud, puoi ridurre le dipendenze dall'infrastruttura di avviso esterna. Per ulteriori informazioni, consulta PromQL in Cloud Monitoring e Criteri di avviso con PromQL.

  • I filtri di monitoraggio ti consentono di configurare i criteri di avviso per utilizzare i rapporti delle metriche basati su filtri. I criteri di avviso basati su filtri non possono essere visualizzati o modificati nella console Google Cloud. Per un esempio di criterio che utilizza i filtri di monitoraggio, consulta Rapporto metrica.

  • Monitoring Query Language (MQL) è un'interfaccia espressiva basata su testo che consente di recuperare, filtrare e manipolare i dati delle serie temporali. Puoi creare criteri di avviso con condizioni che includono un'operazione di avviso di Monitoring Query Language. Per ulteriori informazioni, consulta la panoramica del linguaggio di query di monitoraggio e la sezione Criteri di avviso con MQL.

Gestire gli incidenti e i criteri di avviso

Dopo l'attivazione di un criterio di avviso, il monitoraggio monitora continuamente le relative condizioni. Non puoi configurare il criterio di avviso per monitorare le condizioni solo per determinati periodi di tempo. Se vuoi disattivare il criterio di avviso per un determinato periodo di tempo, crea una spostamento.

Se è aperto un incidente e il monitoraggio determina che le condizioni del criterio basato su metriche non sono più soddisfatte, il monitoraggio chiude automaticamente l'incidente e invia una notifica relativa alla chiusura.

Prezzi

In generale, le metriche di sistema di Cloud Monitoring sono gratuite, mentre quelle provenienti da sistemi, agenti o applicazioni esterni non lo sono. Le metriche fatturabili vengono fatturate in base al numero di byte o al numero di campioni importati.

Per ulteriori informazioni sui prezzi di Cloud Monitoring, consulta i seguenti documenti:

Per informazioni su come monitorare il numero di intervalli di traccia o log che vengono importati o su come ricevere una notifica quando vengono inclusi contenuti specifici in una voce di log, consulta i seguenti documenti:

Passaggi successivi