Gestire gli incidenti per i criteri di avviso basati su SQL

Un incidente è un record del momento in cui viene soddisfatta la condizione di un criterio di avviso. In genere, quando viene soddisfatta una condizione, Cloud Monitoring apre un incidente e invia una notifica quando viene ricevuto un log che corrisponde alla condizione del criterio di avviso. Tuttavia, gli incidenti non vengono creati nelle seguenti circostanze:

  • Il criterio è in posticipazione o disattivato.
  • La frequenza massima delle notifiche supererebbe il limite di 1 notifica ogni 5 minuti per ogni criterio di avviso basato su log.
  • Il totale giornaliero delle notifiche supererebbe il limite di 20 notifiche al giorno per ogni criterio di avviso basato su log.

Per ogni incidente, Monitoring crea una pagina Dettagli incidente che ti consente di gestirlo e che riporta informazioni sull'incidente che possono aiutarti a risolvere il problema. Ad esempio, la pagina Dettagli incidente mostra elenchi di riepiloghi dei risultati delle query SQL e degli incidenti correlati.

Questo documento descrive come trovare gli incidenti. Descrive inoltre come utilizzare la pagina Dettagli incidenti per gestire gli incidenti per i criteri di avviso basati su SQL, che valutano i risultati di una query SQL eseguita sui dati di gruppi di voci di log.

Prima di iniziare

Assicurati di disporre delle autorizzazioni necessarie:

Per ottenere le autorizzazioni necessarie per visualizzare e gestire gli incidenti utilizzando la console Google Cloud, chiedi all'amministratore di concederti i seguenti ruoli IAM nel tuo progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Per ulteriori informazioni sui ruoli di Cloud Monitoring, consulta Controllare l'accesso con Identity and Access Management.

Trovare gli incidenti

Per visualizzare un elenco di incidenti nel tuo progetto Google Cloud:

  1. Nella console Google Cloud, vai alla pagina  Avvisi:

    Vai ad Avvisi

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

    • Il riquadro Riepilogo elenca il numero di incidenti aperti.
    • Il riquadro Incidenti mostra gli incidenti aperti più recenti. Per elencare nella tabella gli incidenti più recenti, inclusi quelli chiusi, fai clic su Mostra incidenti chiusi.
  2. Per visualizzare i dettagli di un incidente specifico, selezionalo nell'elenco.

    Viene visualizzata la pagina Dettagli incidente. Per ulteriori informazioni sulla pagina Dettagli incidente, consulta la sezione Esaminare un incidente di questa pagina.

Trovare incidenti meno recenti

Il riquadro Incidenti nella pagina Allerte mostra gli incidenti aperti più recenti. Per trovare gli incidenti precedenti, esegui una delle seguenti operazioni:

  • Per scorrere le voci nella tabella Incidenti, fai clic su  Più recenti o  Più vecchi.

  • Per accedere alla pagina Incidenti, fai clic su Visualizza tutti gli incidenti. Nella pagina Incidenti puoi eseguire le seguenti operazioni:

    • Mostra incidenti chiusi: per elencare tutti gli incidenti nella tabella, fai clic su Mostra incidenti chiusi.
    • Filtra gli incidenti: per informazioni sull'aggiunta di filtri, consulta Filtra gli incidenti.
    • Conferma o chiudi un incidente oppure posticipa il relativo criterio di avviso. Per accedere a queste opzioni, fai clic su  Altre opzioni nella riga dell'incidente e fai una selezione dal menu. Per saperne di più, consulta Gestire gli incidenti.

Filtra incidenti

Quando inserisci un valore nella barra dei filtri, nella tabella Incidenti vengono elencati solo gli incidenti che corrispondono al filtro. Se aggiungi più filtri, un incidente viene visualizzato solo se soddisfa tutti i filtri.

Per aggiungere un filtro alla tabella degli incidenti:

  1. Nella pagina Incidenti, fai clic su  Filtra tabella e poi seleziona una proprietà filtro. Le proprietà di filtro includono quanto segue:

    • Stato dell'incidente
    • Nome del criterio di avviso
    • Quando l'incidente è stato aperto o chiuso
  2. Seleziona un valore dal menu secondario o inserisci un valore nella barra dei filtri.

Esaminare un incidente

La pagina Dettagli incidente contiene informazioni che possono aiutarti a identificare la causa di un incidente.

Esplorare i risultati delle query

Il riquadro Tempo totale dello slot consumato al giorno mostra il tempo impiegato dagli slot BigQuery riservati per eseguire le query SQL per il criterio di avviso nelle ultime 24 ore.

Il riquadro Risultati delle query SQL mostra un elenco di riepiloghi dei risultati delle query di ogni volta che Log Analytics ha eseguito la query SQL dalla condizione del criterio di avviso. Per impostazione predefinita, l'elenco viene filtrato per mostrare solo le query che corrispondono alla condizione del criterio di avviso.

  • Per visualizzare la query e la tabella dei risultati della query da un momento specifico in cui Log Analytics ha eseguito la query, fai clic su un valore della colonna Ora esecuzione query.
  • Per passare dalla visualizzazione di solo i risultati delle query corrispondenti alla condizione del criterio di avviso a quella di tutte le query eseguite da Log Analytics in base al criterio di avviso, fai clic su Mostra solo le query corrispondenti alle condizioni di avviso.

Visualizza informazioni supplementari

La sezione Documentazione mostra il modello di documentazione per le notifiche che hai fornito durante la creazione del criterio di avviso. Queste informazioni potrebbero includere una descrizione di ciò che viene monitorato dalle norme relative agli avvisi e suggerimenti per la mitigazione. Per saperne di più, consulta la sezione Annotare le notifiche con la documentazione definita dall'utente.

Se non hai configurato la documentazione per il criterio di avviso, nel riquadro Documentazione viene visualizzato il messaggio "Nessuna documentazione configurata".

Per aiutarti a scoprire i problemi sottostanti nella tua applicazione, puoi esaminare gli incidenti relativi ad altre condizioni criterio di avviso.

La sezione Incidenti correlati mostra un elenco di altri incidenti che sono stati creati quando è stata soddisfatta la condizione del criterio di avviso.

Gestire gli incidenti

Gli incidenti si trovano in uno dei seguenti stati:

  •  Aperto: la condizione del criterio di avviso basato su SQL è stata soddisfatta e l'incidente è ancora aperto. Se la stessa condizione viene soddisfatta di nuovo e c'è già un incidente aperto, non viene aperto un nuovo incidente.

  •  Confermato: l'incidente è aperto e è stato contrassegnato manualmente come confermato. In genere, questo stato indica che l'incidente è in fase di indagine.

  •  Chiuso: l'incidente è stato chiuso manualmente o automaticamente al termine del periodo di chiusura automatica.

Confermare gli incidenti

Ti consigliamo di contrassegnare un incidente come riconosciuto quando inizi a esaminarne la causa.

Per contrassegnare un incidente come confermato:

  1. Nel riquadro Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  2. Nella pagina Incidenti, individua l'incidente che vuoi confermare, quindi esegui una delle seguenti operazioni:

    • Fai clic su  Altre opzioni e seleziona Acconsenti.
    • Apri la pagina dei dettagli dell'incidente e fai clic su Conferma incidente.

Posticipare un criterio di avviso

Per impedire a Monitoraggio di creare incidenti e inviare notifiche durante un determinato periodo di tempo, posticipa il criterio di avviso correlato. Quando posticipi un criterio di avviso, gli incidenti correlati rimangono aperti, ma non generano ulteriori notifiche. Gli incidenti vengono chiusi in base alla durata della chiusura automatica del criterio di avviso.

Per creare una posticipazione per un incidente che stai visualizzando:

  1. Nella pagina Dettagli incidente, fai clic su Criteri di posticipazione.

  2. Seleziona la durata della posticipazione. Dopo aver selezionato la durata della posticipazione, la posticipazione inizia immediatamente.

Puoi anche posticipare un criterio di avviso dalla pagina Incidenti individuando l'incidente che vuoi posticipare, facendo clic su  Altre opzioni e selezionando Posticipa. Puoi posticipare i criteri di avviso durante le interruzioni per evitare ulteriori notifiche durante la procedura di risoluzione dei problemi.

Chiudere gli incidenti

Puoi consentire a Monitoring di chiudere un incidente per te oppure puoi chiuderlo autonomamente.

Il monitoraggio chiude automaticamente un incidente quando scade la durata della chiusura automatica per il criterio di avviso. Per impostazione predefinita, la durata della chiusura automatica è di 7 giorni. La durata minima della chiusura automatica è di 30 minuti.

Per chiudere un incidente:

  1. Nel riquadro Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  2. Nella pagina Incidenti, individua l'incidente che vuoi chiudere, quindi esegui una delle seguenti operazioni:

    • Fai clic su  Visualizza altro e poi seleziona Chiudi incidente.
    • Apri la pagina Dettagli incidente relativa all'incidente, quindi fai clic su Chiudi incidente.
Se visualizzi il messaggio Unable to close incident, riprova tra qualche minuto. Non puoi chiudere immediatamente un nuovo incidente perché le condizioni che lo hanno causato sono ancora considerate attive dal sistema di avviso.

Conservazione e limiti dei dati

Per informazioni sui limiti e sul periodo di conservazione degli incidenti, consulta Limiti per gli avvisi.

Passaggi successivi