- A política foi adiada ou desativada.
- A taxa máxima de notificações excederia o limite de 1 notificação a cada 5 minutos para cada política de alertas com base em registros.
- O total diário de notificações excederia o limite de 20 notificações por dia para cada política de alertas com base em registros.
Neste documento, descrevemos como acessar, investigar e gerenciar incidentes para políticas de alertas com base em registros.
Antes de começar
Verifique se você tem as permissões necessárias:
-
Para ter as permissões necessárias para acessar incidentes usando o console do Google Cloud, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Leitor de incidentes do console do Cloud Monitoring (
roles/monitoring.cloudConsoleIncidentViewer
) -
Leitor de contas do Stackdriver (
roles/stackdriver.accounts.viewer
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
-
Leitor de incidentes do console do Cloud Monitoring (
-
Para receber as permissões necessárias para gerenciar incidentes usando o console do Google Cloud, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Editor de incidentes do console do Cloud do Monitoring (
roles/monitoring.cloudConsoleIncidentEditor
) -
Leitor de contas do Stackdriver (
roles/stackdriver.accounts.viewer
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
-
Editor de incidentes do console do Cloud do Monitoring (
Para mais informações sobre os papéis do Cloud Monitoring, consulte Controlar o acesso com o Identity and Access Management.
Encontrar incidentes
Para ver uma lista de incidentes, faça o seguinte:
-
No console do Google Cloud, acesse a página notifications Alertas:
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.
- O painel Resumo lista o número de incidentes abertos.
- O painel Incidentes exibe os incidentes abertos mais recentes. Para listar os incidentes mais recentes na tabela, incluindo aqueles que foram fechados, clique em Mostrar incidentes fechados.
Opcional: para conferir os detalhes de um incidente específico, selecione-o na lista. A página Detalhes do incidente é aberta. Para informações sobre esta página, consulte a seção Investigar incidentes desta página.
Encontrar incidentes antigos
O painel Incidentes na página Alertas mostra os incidentes abertos mais recentes. Para localizar incidentes mais antigos, siga um destes procedimentos:
Para percorrer as entradas na tabela Incidentes, clique em arrow_back_ios Mais recentes ou em arrow_forward_ios Mais antigos.
Para acessar a página Incidentes, clique em Ver todos os incidentes. De página Incidentes, poderá fazer o seguinte:
- Mostrar incidentes fechados: para listar todos os incidentes na tabela, Clique em Mostrar incidentes fechados.
- Filtrar incidentes: para informações sobre como adicionar filtros, consulte Filtrar incidentes.
- Reconheça ou encerre um incidente ou adie a política de alertas. Para acessar essas opções, clique em more_vert Mais opções na linha do incidente e faça uma seleção no menu. Para mais informações, consulte Gerenciar incidentes.
Filtrar incidentes
Quando você insere um valor na barra de filtro, apenas os incidentes correspondentes ao filtro são listados na tabela Incidentes. Se você adicionar vários filtros, um incidente será exibido somente se atender a todos os filtros.
Para adicionar um filtro à tabela de incidentes, faça o seguinte:
Na página Incidentes, clique em filter_list Filtrar tabela e selecione uma propriedade de filtro. As propriedades de filtro incluem todas as seguintes:
- Estado do incidente
- Nome da política de alertas
- quando o incidente foi aberto ou fechado;
Selecione um valor no menu secundário ou digite um valor na barra de filtro.
Investigar incidentes
Após encontrar o incidente que você quer investigar, acesse a página Detalhes do incidente. Para conferir os detalhes, selecione o resumo do incidente na tabela de incidentes nas páginas Alertas ou Incidentes.
Se você recebeu uma notificação que inclui um link para o incidente, use esse link para conferir os detalhes.
A página Detalhes do incidente apresenta as seguintes informações:
Informações de status, incluindo:
- Nome: o nome da política de alertas que causou o o incidente.
- Status: o status do incidente: aberto, confirmado, ou fechados.
- Gravidade: a gravidade do incidente:
- Sem gravidade
- Crítico
- Erro
- Aviso
- Duração: o período durante o qual o incidente foi aberta.
Um painel Logs, que mostra entradas de registro que correspondem à consulta de alertas. O painel permite filtrar essas entradas como parte da investigação.
Para atualizar a lista de entradas de registro, clique em refresh Atualizar. Para conferir os registros no Explorador de registros, clique em open_in_new Ver no Explorador de registros.
Informações sobre a política de alertas que causou o incidente:
Painel Condition: identifica a condição no alerta política que causou o incidente. Para políticas de alertas com base em registros criadas com o Análise de registros, o nome da condição será sempre "Registro condição de correspondência".
Esse painel também mostra o tempo entre as notificações, e a duração do fechamento automático da política de alertas.
Painel Mensagem: fornece uma breve explicação da causa com base na configuração da condição na política de alertas. Esse painel é sempre preenchido.
Painel Documentação: mostra o modelo de documentação para notificações que você forneceu ao criar a política de alertas. Essas informações podem incluir uma descrição do que o e monitoramento de políticas e incluem dicas para mitigação.
Se você pulou esse campo ao criar a política de alertas, o painel vai exibir a mensagem "Nenhuma documentação configurado".
- Rótulos: informa o seguinte:
- Os rótulos e valores do recurso monitorado incluídos na entrada de registro que causou o incidente. Essas informações podem ajudar a identificar os eventos recurso que causou o incidente. Esses rótulos também são relatado na string Message.
- Quaisquer rótulos e valores especificados pelo usuário que você definiu no alerta política. É possível usar esses rótulos para organizar e identificar e políticas de alertas. Os rótulos associados a uma política são listados na seção Rótulos de política, enquanto os rótulos definidos como parte e uma condição são listadas na seção Rótulos de métrica. Os rótulos de metadados só são exibidos quando há um filtro ou agrupamento que depende deles. Para mais informações, consulte Anexar rótulos aos alertas.
A página Detalhes de incidentes também fornece ferramentas para investigar o incidente:
- Links para outras ferramentas de solução de problemas. A configuração do projeto e da política de alertas e a idade do incidente determinam quais links estão disponíveis.
- Para ver a página de detalhes da política de alertas, clique em Ver política.
- Para editar a definição da política de alertas, clique em Editar política.
- Para ver as entradas relacionadas no Explorador de registros, clique em Ver registros. Para mais informações, consulte Confira os registros usando o Análise de registros.
- Anotações: fornece um registro das descobertas, dos resultados, das sugestões
ou de outros comentários da investigação do incidente.
- Para adicionar uma anotação, insira o texto no campo e clique em Adicionar comentário.
- Para descartar o comentário, clique em Cancelar.
Gerenciar incidentes
Os incidentes estão em um dos seguintes estados:
error Abrir: A condição da política de alertas com base em registros foi atendida, e o incidente ainda está aberto. Se a mesma condição for atendida novamente e se já houver um incidente aberto, um novo incidente não será aberto.
warning Reconhecido: o incidente está aberto e foi marcado manualmente como confirmado. Normalmente, esse status indica que o incidente está sendo investigado.
check_circle Fechado: Você encerrou manualmente o incidente ou ele foi fechado automaticamente após o período de fechamento automático.
Como confirmar incidentes
Recomendamos que você marque um incidente como confirmado quando começar a investigar a causa dele.
Para marcar um incidente como confirmado, faça o seguinte:
- No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
Na página Incidentes, encontre o incidente que você quer confirmar e siga um destes procedimentos:
- Clique em more_vert Mais opções e selecione Confirmar.
- Abra a página de detalhes do incidente e clique em Confirmar incidente.
Adiar uma política de alertas
Para impedir que o Monitoring crie incidentes e envie notificações durante um período específico, adie a política de alertas relacionada. Quando você suspende uma política de alertas, os incidentes relacionados a ela permanecem abertos, mas não geram mais notificações. Os incidentes são fechados com base a duração do fechamento automático da política de alertas.
Para criar um adiamento para um incidente que você está visualizando, faça o seguinte:
Na página Detalhes do incidente, clique em Adiar.
Selecione a duração do adiamento. Depois de selecionar a duração do adiamento, ele começa imediatamente.
Quando você acessa a página de detalhes de um incidente, é possível criar um adiamento para a política de alertas relacionada. Para isso, clique em Adiamento e escolha uma duração. O adiamento vai começar imediatamente. Você também pode adiar uma política de alertas na página Incidentes encontrando a incidente que você quer adiar, clicando em more_vert Mais opções e selecione Adiar. É possível adiar as políticas de alertas durante interrupções para evitar notificações durante o processo de solução de problemas.
Fechar incidentes
É possível deixar o Monitoring fechar um incidente para você ou encerre o incidente.
O monitoramento encerra automaticamente um incidente quando o fechamento automático o período de expiração da política de alertas. Por padrão, a duração do fechamento automático é de 7 dias. A duração mínima de fechamento automático é de 30 minutos.
Para fechar um incidente, faça o seguinte:
- No painel Incidentes da página Alertas, clique em Ver todos os incidentes.
Na página Incidentes, encontre o incidente que você quer fechar e siga um destes procedimentos:
- Clique em more_vert Ver mais e selecione Fechar incidente.
- Abra a página de detalhes do incidente e clique em Fechar incidente.
Unable to close incident
, tente novamente depois de alguns
minutos. Não é possível encerrar um novo incidente imediatamente porque as condições
causou o incidente ainda são considerados ativos pelo sistema de alerta.
Retenção e limites de dados
Para informações sobre limites e o período de armazenamento dos incidentes, consulte Limites de alertas.
A seguir
- Para criar e gerenciar políticas de alertas com a API Cloud Logging ou Na linha de comando, consulte Gerenciar políticas de alertas por API.