Incidenti per i criteri di avviso basati su metriche

Un incidente è un record del momento in cui la condizione o la condizione di un criterio di avviso che le condizioni siano soddisfatte. In genere, quando le condizioni sono soddisfatte, Cloud Monitoring apre un incidente e invia una notifica. Tuttavia, Gli incidenti non vengono creati se il criterio viene posticipato o disattivato, quando sono ci sono troppi incidenti aperti per quel criterio o quando la risorsa sottostante è noto per essere disabilitato. Inoltre, quando un criterio di avviso contiene più condizioni, il criterio di avviso specifica se una determinata condizione è sufficienti per causare la creazione di un incidente.

Questo documento descrive come visualizzare, esaminare e gestire gli incidenti per i criteri di avviso basati sulle metriche.

Prima di iniziare

Assicurati di disporre delle autorizzazioni necessarie:

Per ulteriori informazioni sui ruoli di Cloud Monitoring, consulta Controllare l'accesso con Identity and Access Management.

Individua incidenti

Per visualizzare un elenco degli incidenti:

  1. Nella console Google Cloud, vai alla Pagina Avvisi:

    Vai ad Avvisi

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoraggio.

    • Il riquadro Riepilogo elenca il numero di incidenti aperti.
    • Il riquadro Incidenti mostra gli incidenti aperti più recenti. Per elencare gli incidenti più recenti nella tabella, inclusi quelli chiusi, fai clic su Mostra incidenti chiusi.
  2. (Facoltativo) Per visualizzare i dettagli di un incidente specifico, seleziona la incidente nell'elenco. Si apre la pagina Dettagli incidente. Per informazioni consulta la sezione Esaminare incidenti di questa pagina.

Trovare incidenti meno recenti

Il riquadro Incidenti della pagina Avvisi mostra le informazioni incidenti aperti recenti. Per individuare gli incidenti meno recenti, esegui una delle seguenti operazioni:

  • Per scorrere le voci nella tabella Incidenti, fai clic su  Più recenti o  Meno recenti.

  • Per accedere alla pagina Incidenti, fai clic su Visualizza tutti gli incidenti. Da Nella pagina Incidenti, puoi effettuare tutte le seguenti operazioni:

    • Mostra incidenti chiusi: per elencare tutti gli incidenti nella tabella, Fai clic su Mostra incidenti chiusi.
    • Filtrare gli incidenti: per informazioni sull'aggiunta di filtri, consulta Filtrare gli incidenti
    • Conferma o chiudi un incidente oppure posticipa il relativo criterio di avviso. Per accedere a queste opzioni, fai clic su  Altre opzioni nella riga dell'incidente, ed effettua una selezione dal menu. Per ulteriori informazioni, consulta Gestire gli incidenti.

Filtra incidenti

Quando inserisci un valore nella barra dei filtri, vengono rilevati solo gli incidenti che corrispondono sono elencati nella tabella Incidenti. Se aggiungi più filtri, un incidente viene visualizzato solo se soddisfa tutti i filtri.

Per aggiungere un filtro alla tabella degli incidenti:

  1. Nella pagina Incidenti, fai clic su  Filtra tabella e poi seleziona una proprietà di filtro. Le proprietà di filtro includono tutte le seguenti:

    • Stato dell'incidente
    • Nome del criterio di avviso
    • Quando l'incidente è stato aperto o chiuso
    • Tipo di metrica
    • Tipo di risorsa
  2. Seleziona un valore dal menu secondario o inserisci un valore nella barra dei filtri.

    Ad esempio, se selezioni Tipo di metrica e inserisci usage_time, potresti vedere solo le seguenti opzioni nel menu secondario:

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time
    

Esamina gli incidenti

Dopo aver individuato l’incidente su cui vuoi indagare, vai alla Dettagli incidente per l'incidente in questione. Per visualizzare i dettagli: selezionare il riepilogo degli incidenti nella tabella degli incidenti Avvisi o la pagina Incidenti.

In alternativa, se hai ricevuto una notifica che include un link alla incidente, puoi utilizzare questo link per visualizzare i dettagli dell'incidente.

La pagina Dettagli incidente fornisce le seguenti informazioni:

  • Informazioni sullo stato, tra cui:

    • Nome: il nome del criterio di avviso che ha causato l'errore incidente.
    • Stato: lo stato dell'incidente: aperto, confermato, o chiuso.
    • Gravità: la gravità dell'incidente.
        .
      • Nessuna gravità
      • Critico
      • Errore
      • Avviso
    • Durata: il periodo di tempo durante il quale è stato riscontrato l'incidente. aperta.
  • Informazioni sul criterio di avviso che ha causato l'incidente:

    • Riquadro Condizione: identifica la condizione nell'avviso che ha causato l'incidente.

    • Riquadro Messaggio: fornisce una breve spiegazione della causa in base alla configurazione della condizione nel criterio di avviso. Questo riquadro viene sempre compilato.

    • Riquadro Documentazione: mostra il modello di documentazione per le notifiche che hai fornito durante la creazione del criterio di avviso. Queste informazioni potrebbero includere una descrizione di ciò che monitorare le norme e includere suggerimenti per la mitigazione.

      Se hai saltato questo campo durante la creazione del criterio di avviso, questo riquadro riporta il messaggio "Nessuna documentazione configurato."

  • Etichette: indica quanto segue:
      .
    • Le etichette e i valori per la risorsa e la metrica monitorate della serie temporale che ha causato l'incidente. Queste informazioni possono aiutarti a identificare lo specifico alla risorsa che ha causato l'incidente.

      Quando usi le variabili nella documentazione per le etichette delle metriche, Il monitoraggio omette l'etichetta dalle notifiche quando il valore dell'etichetta non inizia con una cifra, una lettera una barra (/), o un segno di uguale (=).

    • Qualsiasi etichetta e valore specificato dall'utente che hai definito nell'avviso . Puoi utilizzare queste etichette per organizzare e identificare criteri di avviso. Vengono elencate le etichette associate a un criterio. nella sezione Etichette norme, mentre le etichette definite come parte sono elencate nella sezione Etichette delle metriche. Metadati le etichette vengono visualizzate solo quando è presente un filtro o raggruppamento dipende dall'etichetta. Per ulteriori informazioni, vedi Annota gli avvisi con le etichette.

La pagina Dettagli incidenti fornisce inoltre strumenti per l'indagine l'incidente:

  • Cronologia dell'incidente: mostra due rappresentazioni visive del incidente:

    • Sulla sequenza temporale, una barra rossa rappresenta la data e l'ora di un incidente; la lunghezza e la posizione della barra riflettono la durata dell'incidente.
    • Un grafico mostra i dati delle serie temporali e la soglia utilizzati il criterio di avviso che ha causato l'incidente. L'incidente è stato si apre quando alcune serie temporali soddisfacevano una condizione del criterio di avviso.

    L'asse del tempo indica la durata dell'incidente con due etichette punti. La posizione di questi punti sull'asse del tempo determina l'intervallo di dati mostrati sul grafico che accompagna la sequenza temporale dell'incidente. Di per impostazione predefinita, un punto è posizionato in corrispondenza dell'apertura dell'incidente e uno alla fine dell’incidente o al momento attuale, se l’incidente è ancora aperti.

    Puoi modificare l'intervallo di tempo sulla cronologia dell'incidente e nel grafico:

    • Per modificare l'intervallo di tempo mostrato sul grafico, trascina uno dei due punti lungo l'asse del tempo. Utilizzando questa tecnica, puoi a intervalli specifici, ad esempio intorno all'inizio o alla fine dell'incidente.

      Modificando il grafico trascinando i punti sull'asse, viene impostata una nel menu Intervallo di tempo e disattiva il menu. Per attivare il menu Intervallo di tempo, fai clic su Reimposta.

    • Per modificare l'intervallo di tempo mostrato sulla sequenza temporale, seleziona un intervallo dal menu Intervallo di tempo.
  • Link ad altri strumenti per la risoluzione dei problemi. La configurazione del progetto e il criterio di avviso, così come l'età dell'incidente, quali link sono disponibili.
    • Per visualizzare la pagina dei dettagli del criterio di avviso, fai clic su Visualizza .
    • Per modificare la definizione del criterio di avviso, fai clic su Modifica. .
    • Per accedere a una dashboard con informazioni sulle prestazioni della risorsa, fai clic su Visualizza dettagli risorsa.
    • Per visualizzare le voci di log correlate in Esplora log, fai clic su Visualizza i log. Per ulteriori informazioni, vedi Visualizza i log utilizzando il comando Esplora log.
    • Per esaminare i dati nel grafico, fai clic su Visualizza in Esplora metriche.
  • Annotazioni: fornisce un log di risultati, risultati, suggerimenti o altri commenti in seguito alla tua indagine sull'incidente.
    • Per aggiungere un'annotazione, inserisci il testo nel campo e fai clic su Aggiungi commento.
    • Per ignorare il commento, fai clic su Annulla.

Gestisci incidenti

Gli incidenti si verificano in uno dei seguenti stati:

  • Aperto: L'insieme di condizioni del criterio di avviso è stato soddisfatto o non sono disponibili dati per indicare che la condizione non è più soddisfatta. Se un criterio di avviso contiene più condizioni, gli incidenti vengono aperti, su come vengono combinate queste condizioni. Per ulteriori informazioni, vedi Norme con più condizioni.

  • Accettati: L'incidente è aperto ed è stato contrassegnato manualmente come confermato. In genere, Questo stato indica che l'incidente è in fase di indagine.

  • Chiuso: Il sistema ha osservato che la condizione non è più soddisfatta, hai chiuso l'incidente, oppure se sono trascorsi 7 giorni senza una che la condizione ha continuato a essere soddisfatta.

Quando configuri un criterio di avviso, assicurati che lo stato stabile fornisce un segnale quando è tutto a posto. Questa operazione è necessaria per garantire lo stato privo di errori può essere identificato e, se un incidente è aperto, per l'incidente da chiudere. Se non viene visualizzato alcun segnale che indichi un errore interrotta, dopo essere stato aperto, l'incidente rimane aperto 7 giorni dopo l'attivazione del criterio di avviso.

Ad esempio, se crei un criterio di avviso che ti avvisa quando il conteggio di errori è maggiore di 0, assicurati che produca un conteggio pari a 0 quando non sono presenti errori. Se il criterio di avviso restituisce un valore vuoto nello stato privo di errori, non c'è segnale che indichi quando sono stati interrotti. In alcune situazioni, Monitoring Query Language (MQL) supporta possibilità di specificare un valore predefinito da utilizzare quando non è presente alcun valore misurato è disponibile. Ad esempio, consulta Utilizza rapporto.

Conferma degli incidenti

Ti consigliamo di contrassegnare un incidente come confermato quando inizi indaga sulla causa dell'incidente.

Per contrassegnare un incidente come confermato:

  • Nel riquadro Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  • Nella pagina Incidenti, trova l'incidente che vuoi confermare. ed esegui una delle seguenti operazioni:

    • Fai clic su  Altre opzioni e seleziona Accetta.
    • Apri la pagina dei dettagli dell'incidente e fai clic su Accetta l'incidente.

Se il criterio di avviso è configurato su inviare notifiche ripetute e poi confermare un l'incidente non interrompe le notifiche. Per interromperle, procedi in uno dei seguenti modi:

  • Crea una posticipazione per il criterio di avviso.
  • Disabilita il criterio di avviso.

Posticipare un criterio di avviso

Per impedire a Monitoring di creare incidenti e inviare notifiche durante un periodo di tempo specifico, posticipa il relativo criterio di avviso. Quando posticipi un criterio di avviso, Monitoring chiude anche tutti incidenti correlati al criterio di avviso.

Per creare una posticipazione per un incidente che stai visualizzando:

  1. Nella pagina Dettagli incidente, fai clic su Posticipa.

  2. Seleziona la durata della posticipazione. Dopo aver selezionato la durata della posticipazione, inizia immediatamente.

Quando visualizzi la pagina dei dettagli di un incidente, puoi creare una posticipazione per il al criterio di avviso correlato facendo clic su Posticipa e scegliendo un durata massima. La posticipazione inizia immediatamente. Puoi anche Posticipa un criterio di avviso dalla pagina Incidenti trovando il l'incidente che vuoi posticipare, facendo clic  Altre opzioni, quindi seleziona Posticipa. Puoi posticipare i criteri di avviso durante le interruzioni per evitare ulteriori notifiche durante la procedura di risoluzione dei problemi.

Chiudi incidenti

Puoi consentire a Monitoring di chiudere un incidente per te oppure chiudere un incidente dopo che le osservazioni hanno smesso di arrivare. Se chiudi un incidente e poi arrivano i dati che indicano la condizione viene soddisfatto, viene creato un nuovo incidente. Quando chiudi un incidente, l'azione non chiude gli altri incidenti aperti per il la stessa condizione. Se posticipi un criterio di avviso, gli incidenti aperti vengono chiusa all'inizio della posticipazione.

Il monitoraggio chiude automaticamente un incidente quando si verificano quanto segue:

  • Condizioni soglia metrica:

    • Arriva un'osservazione che indica che la soglia non è stata violata.
    • Nessuna osservazione, la condizione è configurata per chiudere gli incidenti all'interruzione delle osservazioni e lo stato della risorsa sottostante è sconosciuto o non è disattivato.

    • Non vengono ricevute osservazioni per la durata della chiusura automatica dell'avviso e la condizione non è configurata per chiudere automaticamente gli incidenti all'arresto delle osservazioni. Per configurare la chiusura automatica durata massima, puoi utilizzare la console Google Cloud o l'API Cloud Monitoring. Per impostazione predefinita, la durata della chiusura automatica è per sette giorni. La durata minima della chiusura automatica è di 30 minuti.

  • Condizioni di assenza metrica:

    • Si verifica un'osservazione.
    • Nessuna osservazione per le 24 ore successive scade la durata della chiusura automatica del criterio di avviso. Per configurare durata della chiusura automatica, puoi utilizzare la console Google Cloud l'API Cloud Monitoring. Per impostazione predefinita, la durata della chiusura automatica è per sette giorni.
  • Condizioni di previsione:

    • Viene prodotta una previsione e prevede che le serie temporali non violino la soglia entro la finestra di previsione.
    • Nessuna osservazione per 10 minuti, la condizione è configurata per chiudere gli incidenti quando interrompono l'arrivo delle osservazioni lo stato della risorsa sottostante è sconosciuto o non è disabilitato.

    • Non vengono ricevute osservazioni per la durata della chiusura automatica dell'avviso e la condizione non è configurata per chiudere automaticamente gli incidenti all'arresto delle osservazioni.

Ad esempio, un criterio di avviso ha generato un incidente perché La latenza della risposta HTTP è stata superiore a 2 secondi per 10 minuti. Se la misurazione successiva della latenza della risposta HTTP è inferiore a o uguale a due secondi, allora l'incidente è chiuso. Analogamente, se non vengono ricevuti dati per sette giorni, l'incidente viene chiuso.

Per chiudere un incidente:

  1. Nel riquadro Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  2. Nella pagina Incidenti, individua l'incidente che vuoi chiudere. ed esegui una delle seguenti operazioni:

    • Fai clic su  Visualizza altro e poi seleziona Chiudi incidente.
    • Apri la pagina dei dettagli dell'incidente e fai clic su Chiudi incidente.

Se viene visualizzato il messaggio Unable to close incident with active conditions, l'incidente non può essere chiuso perché i dati sono stati ricevuti entro nel periodo di avviso più recente.

Se viene visualizzato il messaggio Unable to close incident. Please try again in a few minutes., non è stato possibile chiudere l'incidente a causa di un errore interno.

Conservazione dei dati e limiti

Per informazioni sui limiti e sul periodo di conservazione degli incidenti, consulta Limiti per gli avvisi.

Passaggi successivi

* Per un trattamento concettuale dettagliato dei criteri di avviso, vedi Comportamento dei criteri di avviso basati su metriche.