Gerenciar incidentes de políticas de alertas com base em registros

Um incidente é um registro de quando a condição de uma política de alertas é atendida. Normalmente, quando uma condição é atendida, o Cloud Monitoring abre um incidente e envia uma notificação quando um registro é recebido que corresponde à condição da política de alertas. No entanto, os incidentes não são criados circunstâncias:

  • A política foi adiada ou desativada.
  • A taxa máxima de notificações excederia o limite de 1 notificação a cada 5 minutos para cada política de alertas com base em registros.
  • O total diário de notificações excederia o limite de 20 notificações por dia para cada política de alertas baseada em registro.

Para cada incidente, o Monitoring cria uma página Detalhes do incidente que permite gerenciar o incidente e informa informações sobre o incidente que podem ajudar a resolver a falha. Por exemplo, a página Detalhes do incidente mostra uma lista de entradas de registro que correspondam à consulta da política de alertas com base em registros. Você também pode encontrar links para incidentes relacionados.

Neste documento, descrevemos como encontrar incidentes. Também descreve como usar a página Detalhes do incidente para gerenciar incidentes de políticas de alertas com base em registros, que avaliam os dados de entrada de registro armazenados em registros individuais no Cloud Logging.

Antes de começar

Verifique se você tem as permissões necessárias:

Para ter as permissões necessárias para visualizar e gerenciar incidentes usando o console do Google Cloud, peça ao administrador para conceder a você os seguintes papéis do IAM no seu projeto:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

Para mais informações sobre os papéis do Cloud Monitoring, consulte Controlar o acesso com o Identity and Access Management.

Encontrar incidentes

Para conferir uma lista de incidentes no seu projeto do Google Cloud, faça o seguinte:

  1. No console do Google Cloud, acesse a página  Alertas:

    Acessar Alertas

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.

    • O painel Resumo lista o número de incidentes abertos.
    • O painel Incidentes mostra os incidentes abertos mais recentes. Para listar os incidentes mais recentes na tabela, incluindo aqueles que foram fechados, clique em Mostrar incidentes fechados.
  2. Para conferir os detalhes de um incidente específico, selecione-o na lista.

    A página Detalhes do incidente é aberta. Para mais informações sobre a página Detalhes do incidente, consulte a seção Investigar um incidente desta página.

Encontrar incidentes mais antigos

O painel Incidentes na página Alertas mostra os incidentes abertos mais recentes. Para localizar incidentes mais antigos, siga um destes procedimentos:

  • Para percorrer as entradas na tabela Incidentes, clique em  Mais recentes ou em  Mais antigos.

  • Para acessar a página Incidentes, clique em Ver todos os incidentes. Na página Incidentes, é possível fazer o seguinte:

    • Mostrar incidentes fechados: para listar todos os incidentes na tabela, Clique em Mostrar incidentes fechados.
    • Filtrar incidentes: para informações sobre como adicionar filtros, consulte Filtrar incidentes.
    • Reconheça ou encerre um incidente ou adie a política de alertas. Para acessar essas opções, Clique em  Mais opções na linha do incidente. e escolha uma opção no menu. Para mais informações, consulte Gerenciar incidentes.

Filtrar incidentes

Quando você insere um valor na barra de filtro, apenas os incidentes correspondentes ao filtro são listados na tabela Incidentes. Se você adicionar vários filtros, um incidente será exibido somente se atender a todos os filtros.

Para adicionar um filtro à tabela de incidentes, faça o seguinte:

  1. Na página Incidentes, clique em  Filtrar tabela e selecione uma propriedade de filtro. As propriedades do filtro incluem as seguintes opções:

    • Estado do incidente
    • Nome da política de alertas
    • quando o incidente foi aberto ou fechado;
  2. Selecione um valor no menu secundário ou digite um valor na barra de filtro.

Investigar um incidente

A página Detalhes do incidente contém informações que podem ajudar a identificar a causa de um incidente.

Analisar entradas de registro

Analise as entradas de registro para encontrar padrões e problemas recorrentes relacionados à investigação. O painel Logs mostra entradas de registro que correspondem à consulta da sua política de alertas com base em registros.

  • Para visualizar as entradas de registro na Análise de registros, clique em Confira na Análise de registros e selecione um projeto de escopo.
  • Para visualizar o painel "Registros" no Metrics Explorer, clique em Explorar dados.

Conferir informações complementares

A seção Rótulos mostra os rótulos e valores do recurso monitorado na entrada de registro que causou o incidente. Essas informações podem ajudar a identificar o recurso monitorado específico que causou o incidente. Para mais informações, consulte Anotar incidentes com rótulos.

A seção Documentação mostra o modelo de documentação de que você forneceu ao criar a política de alertas. Essas informações podem incluir uma descrição do que o e monitoramento de políticas e incluem dicas para mitigação. Para mais informações, consulte Anotar notificações com documentação definida pelo usuário.

Se você não tiver configurado a documentação para a política de alertas, o painel Documentação vai mostrar a mensagem "Nenhuma documentação está configurada".

Para ajudar a descobrir problemas subjacentes no seu aplicativo, você pode analisar incidentes relacionados a outras condições de política de alertas.

A seção Incidentes relacionados mostra uma lista de incidentes. que correspondam a um dos seguintes:

  • O incidente foi criado quando uma condição da mesma política de alertas foi atendidas.
  • O incidente compartilha um rótulo com o incidente mostrado na página de detalhes do incidente.

Gerenciar incidentes

Os incidentes estão em um dos seguintes estados:

  • Aberto: A condição da política de alertas com base em registros foi atendida, e o incidente ainda está aberto. Se a mesma condição for atendida novamente se já houver um incidente aberto, um novo incidente não será aberto.

  •  Reconhecido: o incidente está aberto e foi marcado manualmente como confirmado. Normalmente, esse status indica que o incidente está sendo investigado.

  • Fechado: Você encerrou manualmente o incidente ou ele foi fechado automaticamente após o período de fechamento automático.

Reconhecer incidentes

Recomendamos que você marque um incidente como confirmado quando começar a investigar a causa dele.

Para marcar um incidente como confirmado, faça o seguinte:

  1. No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
  2. Na página Incidentes, encontre o incidente que você quer confirmar e siga um destes procedimentos:

    • Clique em  Mais opções e selecione Confirmar.
    • Abra a página de detalhes do incidente e clique em Confirmar incidente.

Adiar uma política de alertas

Para impedir que o Monitoring crie incidentes e envie notificações durante um período específico, adie a política de alertas relacionada. Quando você adiar uma política de alertas, os incidentes relacionados a ela vão permanecer abertos, mas não vão gerar mais notificações. Os incidentes são fechados com base na duração do fechamento automático da política de alertas.

Para criar um adiamento para um incidente que você está visualizando, faça o seguinte:

  1. Na página Detalhes do incidente, clique em Política de adiamento.

  2. Selecione a duração da suspensão. Depois de selecionar a duração do adiamento, ele começa imediatamente.

Também é possível adiar uma política de alertas na página Incidentes. Basta encontrar o incidente que você quer adiar, clicando em  Mais opções e selecione Adiar. É possível adiar as políticas de alertas durante interrupções para evitar notificações durante o processo de solução de problemas.

Fechar incidentes

É possível permitir que o Monitoring feche um incidente ou encerrar o incidente.

O monitoramento encerra automaticamente um incidente quando o fechamento automático o período de expiração da política de alertas. Por padrão, a duração do fechamento automático é de 7 dias. A duração mínima de fechamento automático é de 30 minutos.

Para fechar um incidente, faça o seguinte:

  1. No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
  2. Na página Incidentes, encontre o incidente que você quer fechar e siga um destes procedimentos:

    • Clique em  Ver mais e selecione Fechar incidente.
    • Abra a página Detalhes do incidente e clique em Fechar incidente.
Se você vir a mensagem Unable to close incident, tente novamente depois de alguns minutos. Não é possível encerrar um novo incidente imediatamente porque as condições causou o incidente ainda são considerados ativos pelo sistema de alerta.

Retenção e limites de dados

Para informações sobre limites e o período de armazenamento dos incidentes, consulte Limites de alertas.

A seguir