- A política está suspensa ou desativada.
- A taxa máxima de notificações excederia o limite de uma notificação a cada 5 minutos para cada política de alertas baseada em registro.
- O total diário de notificações excederia o limite de 20 notificações por dia para cada política de alertas baseada em registro.
Para cada incidente, o Monitoring cria uma página Detalhes do incidente que permite gerenciar o incidente e informa informações sobre o incidente que podem ajudar a resolver a falha. Por exemplo, a página Detalhes do incidente mostra listas de resumos de resultados de consulta SQL e incidentes relacionados.
Este documento descreve como encontrar seus incidentes. Também descreve como usar a página Detalhes do incidente para gerenciar incidentes de políticas de alerta baseadas em SQL, que avaliam os resultados de uma consulta SQL executada em relação aos dados de grupos de entradas de registro.
Antes de começar
Verifique se você tem as permissões necessárias:
Para ter as permissões necessárias para visualizar e gerenciar incidentes usando o console do Google Cloud, peça ao administrador para conceder a você os seguintes papéis do IAM no seu projeto:
-
Para conferir os incidentes usando o console do Google Cloud:
-
Visualizador de incidentes do Cloud Console do Monitoring (
roles/monitoring.cloudConsoleIncidentViewer
) -
Leitor de contas do Stackdriver (
roles/stackdriver.accounts.viewer
)
-
Visualizador de incidentes do Cloud Console do Monitoring (
-
Gerenciar incidentes usando o console do Google Cloud:
-
Editor de incidentes do Console do Cloud Monitoring (
roles/monitoring.cloudConsoleIncidentEditor
) -
Leitor de contas do Stackdriver (
roles/stackdriver.accounts.viewer
)
-
Editor de incidentes do Console do Cloud Monitoring (
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Para mais informações sobre os papéis do Cloud Monitoring, consulte Controlar o acesso com o Identity and Access Management.
Encontrar incidentes
Para conferir uma lista de incidentes no seu projeto do Google Cloud, faça o seguinte:
-
No console do Google Cloud, acesse a página notifications Alertas:
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.
- O painel Resumo lista o número de incidentes abertos.
- O painel Incidentes mostra os incidentes abertos mais recentes. Para listar os incidentes mais recentes na tabela, incluindo aqueles que foram fechados, clique em Mostrar incidentes fechados.
Para conferir os detalhes de um incidente específico, selecione-o na lista.
A página Detalhes do incidente é aberta. Para mais informações sobre a página Detalhes do incidente, consulte a seção Investigar um incidente desta página.
Encontrar incidentes mais antigos
O painel Incidentes na página Alertas mostra os incidentes abertos mais recentes. Para localizar incidentes mais antigos, siga um destes procedimentos:
Para percorrer as entradas na tabela Incidentes, clique em arrow_back_ios Mais recentes ou em arrow_forward_ios Mais antigos.
Para acessar a página Incidentes, clique em Ver todos os incidentes. Na página Incidentes, é possível fazer o seguinte:
- Mostrar incidentes fechados: para listar todos os incidentes na tabela, clique em Mostrar incidentes fechados.
- Filtrar incidentes: para mais informações sobre como adicionar filtros, consulte Filtrar incidentes.
- Confirmar ou fechar um incidente ou adiar a política de alertas. Para acessar essas opções, clique em more_vert Mais opções na linha do incidente e faça uma seleção no menu. Para mais informações, consulte Gerenciar incidentes.
Filtrar incidentes
Quando você insere um valor na barra de filtro, apenas os incidentes correspondentes ao filtro são listados na tabela Incidentes. Se você adicionar vários filtros, um incidente será exibido somente se atender a todos os filtros.
Para adicionar um filtro à tabela de incidentes, faça o seguinte:
Na página Incidentes, clique em filter_list Filtrar tabela e selecione uma propriedade de filtro. As propriedades do filtro incluem as seguintes opções:
- Estado do incidente
- Nome da política de alertas
- quando o incidente foi aberto ou fechado;
Selecione um valor no menu secundário ou digite um valor na barra de filtro.
Investigar um incidente
A página Detalhes do incidente contém informações que podem ajudar a identificar a causa de um incidente.
Explorar resultados da consulta
O painel Total de tempo de slot consumido por dia mostra o tempo que seus slots reservados do BigQuery passaram executando as consultas SQL da política de alertas nas últimas 24 horas.
O painel Resultados da consulta SQL mostra uma lista de resumos dos resultados de consulta de cada vez que a Análise de dados de registros executou a consulta SQL da condição da política de alertas. Por padrão, a lista é filtrada para mostrar apenas as consultas que correspondem à condição da política de alertas.
- Para conferir a consulta e a tabela de resultados de uma hora específica em que o Log Analytics executou a consulta, clique em um valor na coluna Query run time.
- Para alternar entre a exibição de apenas os resultados de consulta que correspondem à condição da política de alertas e todas as consultas que o Log Analytics executou com base na política de alertas, clique em Mostrar apenas consultas que correspondem às condições de alerta.
Conferir informações complementares
A seção Documentação mostra o modelo de documentação para as notificações que você forneceu ao criar a política de alertas. Essas informações podem incluir uma descrição do que a política de alertas monitora e dicas para mitigação. Para mais informações, consulte Anexar anotações a notificações com documentação definida pelo usuário.
Se você não tiver configurado a documentação para a política de alertas, o painel Documentação vai mostrar "Nenhuma documentação está configurada".
Analisar incidentes relacionados
Para ajudar a descobrir problemas subjacentes no seu aplicativo, você pode analisar incidentes relacionados a outras condições da política de alertas.
A seção Incidentes relacionados mostra uma lista de outros incidentes que foram criados quando a condição da política de alertas foi atendida.Gerenciar incidentes
Os incidentes estão em um dos seguintes estados:
error Aberto: A condição da política de alertas com base em SQL foi atendida, e o incidente ainda está aberto. Se a mesma condição for atendida novamente e já houver um incidente aberto, um novo incidente não será aberto.
warning Reconhecido: o incidente está aberto e foi marcado manualmente como confirmado. Normalmente, esse status indica que o incidente está sendo investigado.
check_circle Fechado: Você encerrou manualmente o incidente ou ele foi fechado automaticamente após o período de fechamento automático.
Confirmar incidentes
Recomendamos que você marque um incidente como confirmado quando começar a investigar a causa dele.
Para marcar um incidente como confirmado, faça o seguinte:
- No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
Na página Incidentes, encontre o incidente que você quer confirmar e siga um destes procedimentos:
- Clique em more_vert Mais opções e selecione Confirmar.
- Abra a página de detalhes do incidente e clique em Confirmar incidente.
Suspender uma política de alertas
Para impedir que o monitoramento crie incidentes e envie notificações durante um período específico, adie a política de alertas relacionada. Quando você adiar uma política de alertas, os incidentes relacionados a ela vão permanecer abertos, mas não vão gerar mais notificações. Os incidentes são fechados com base na duração do fechamento automático da política de alertas.
Para criar um adiamento para um incidente que você está visualizando, faça o seguinte:
Na página Detalhes do incidente, clique em Política de suspensão.
Selecione a duração da suspensão. Depois de selecionar a duração do adiamento, ele começa imediatamente.
Também é possível suspender uma política de alertas na página Incidentes. Encontre o incidente que você quer suspender, clique em more_vert Mais opções e selecione Suspender. É possível adiar as políticas de alertas durante interrupções para evitar notificações durante o processo de solução de problemas.
Fechar incidentes
É possível permitir que o Monitoring feche um incidente ou encerrar o incidente.
O Monitoring fecha automaticamente um incidente quando a duração do fechamento automático da política de alertas expira. Por padrão, a duração do fechamento automático é de 7 dias. A duração mínima de fechamento automático é de 30 minutos.
Para fechar um incidente, faça o seguinte:
- No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
Na página Incidentes, encontre o incidente que você quer fechar e siga um destes procedimentos:
- Clique em more_vert Ver mais e selecione Fechar incidente.
- Abra a página Detalhes do incidente desse incidente e clique em Fechar incidente.
Unable to close incident
, tente novamente depois de alguns
minutos. Não é possível fechar um novo incidente imediatamente porque as condições que
causaram o incidente ainda são consideradas ativas pelo sistema de alertas.
Retenção e limites de dados
Para informações sobre limites e o período de armazenamento de incidentes, consulte Limites de alerta.
A seguir
- Para criar e gerenciar políticas de alertas com a API Cloud Logging ou a partir da linha de comando, consulte Gerenciar políticas de alertas por API.