Esta página foi traduzida pela API Cloud Translation.

Criar políticas de alertas de ausência de métrica

Este documento descreve como usar o console do Google Cloud para criar uma política de alertas que envia notificações quando uma série de tempo monitorada não tem dados para um período específico.

As condições de ausência de métrica exigem pelo menos uma medição bem-sucedida, uma que recupere dados, dentro do período máximo após a instalação ou modificação da política. Esse período é chamado de tempo de ausência do acionador. O tempo máximo de ausência de gatilho configurável é de 23,5 horas.

Por exemplo, vamos supor que você defina o tempo de ausência do acionador em uma política de ausência de métrica como 30 minutos. A condição não será atendida quando o subsistema que grava dados de métrica nunca tiver gravado um ponto de dados. O subsistema precisa produzir pelo menos um ponto de dados e, em seguida, deixar de produzir pontos de dados adicionais por 30 minutos.

Este conteúdo não se aplica a políticas de alertas baseadas em registros. Para informações sobre políticas de alertas baseadas em registros, que informam quando uma mensagem específica aparece nos registros, consulte Como monitorar seus registros.

Este documento não descreve o seguinte:

Como receber notificações quando os valores de uma métrica são maiores ou menores que um limite. Para mais informações, consulte Criar políticas de alertas de limite de métrica.

Como receber notificações com base no valor previsto de uma métrica. Para mais informações, consulte Criar políticas de alertas de valor de métrica previsto.

Como criar uma política de alertas usando a API Cloud Monitoring. Para mais informações, consulte Criar políticas de alertas usando a API.
Como criar uma política de alertas com uma condição que inclui uma consulta da linguagem de consulta do Monitoring (MQL). Essas políticas podem usar um limite estático ou dinâmico. Para mais informações, consulte estes documentos:
- Políticas de alertas com a MQL.
- Crie níveis de gravidade dinâmicos usando a MQL.

Esse recurso só é compatível com projetos do Google Cloud.

Antes de começar

Para receber as permissões necessárias para criar e modificar políticas de alertas usando o console do Google Cloud, peça ao administrador para conceder a você o papel do IAM de Editor do Monitoring (roles/monitoring.editor) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

Para mais informações sobre os papéis do Cloud Monitoring, consulte Controlar o acesso com o Identity and Access Management.
Familiarize-se com os conceitos gerais das políticas de alertas. Para informações sobre esses tópicos, consulte Visão geral de alertas.
Configure os canais de notificação que você quer usar para receber notificações. Para fins de redundância, recomendamos que você crie vários tipos de canais de notificação. Para saber mais, consulte Criar e gerenciar canais de notificação.

Criar política de alertas

Para criar uma política de alertas que envie notificações quando uma série temporal monitorada não tiver dados para um tempo de ausência de acionador específico, faça o seguinte:

No console do Google Cloud, acesse a página Alertas:
Acessar Alertas

Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.
Na barra de ferramentas do console do Google Cloud, selecione seu projeto.
Selecione Criar política.
Selecione a série temporal que será monitorada:
1. Clique em Selecionar uma métrica, navegue pelos menus para selecionar um tipo de recurso e de métrica e clique em Aplicar.
  
  O menu Selecionar uma métrica contém recursos que ajudam a encontrar os tipos de métrica disponíveis:
  - Para encontrar um tipo de métrica específico, use a barra de filtro. Por exemplo, se você inserir util, o menu será restrito para mostrar entradas que incluem util. As entradas são mostradas quando passam em um teste "contains" indiferente a maiúsculas.
  É possível monitorar qualquer métrica integrada ou definida pelo usuário.
2. Opcional: para monitorar um subconjunto da série temporal que corresponda aos tipos de métrica e recurso selecionados na etapa anterior, clique em Adicionar filtro. Na caixa de diálogo de filtro, selecione o rótulo que você quer filtrar, um comparador e o valor do filtro. Por exemplo, o filtro zone =~ ^us.*.a$ usa uma expressão regular para corresponder a todos os dados de série temporal em que o nome da zona começa com us e termina com a. Para mais informações, consulte Filtrar a série temporal selecionada.
3. Opcional: para mudar como os pontos em uma série temporal são alinhados, na seção Transformar dados, defina os campos Janela de rolagem e Função de janela de rolagem.
  
  Se você estiver monitorando uma métrica com base em registros, recomendamos que o menu Janela móvel seja definido para pelo menos 10 minutos.
  
  Esses campos especificam como os pontos registrados em uma janela são combinados. Por exemplo, suponha que a janela seja de 15 minutos e que a função da janela seja max. O ponto alinhado é o valor máximo de todos os pontos nos 15 minutos mais recentes. Para mais informações, consulte Alinhamento: regularização em série.
4. Opcional: combine séries temporais quando quiser reduzir o número de séries temporais monitoradas por uma política ou quando quiser monitorar apenas uma coleção de séries temporais. Por exemplo, em vez de monitorar a utilização da CPU de cada instância de VM, você pode calcular a média da utilização da CPU de todas as VMs em uma zona e, em seguida, monitorar essa média. Por padrão, as séries temporais não são combinadas. Para informações gerais, consulte Redução: combinar séries temporais.
  
  Para combinar todas as séries temporais, faça o seguinte:
  1. Na seção Across time series, clique em Expand.
  2. Defina o campo Agregação de séries temporais com um valor diferente de none. Por exemplo, para mostrar o valor médio da série temporal, selecione mean.
  3. O campo Agrupar por série temporal precisa estar vazio.
  Para combinar ou agrupar séries temporais por valores de rótulo, faça o seguinte:
  1. Na seção Across time series, clique em Expand.
  2. Defina o campo Agregação de séries temporais com um valor diferente de none.
  3. No campo Agrupar por série temporal, selecione os identificadores que serão usados para agrupar.
  Por exemplo, se você agrupar pelo rótulo zone e definir o campo de agregação como mean, o gráfico vai mostrar uma série temporal para cada zona com dados. A série temporal mostrada para uma zona específica é a média de todas as séries temporais com essa zona.
  
  Observação: para excluir um agrupamento, limpe o campo Agrupar por série temporal e defina o campo Agregação de série temporal como none.
5. Clique em Próxima.
Configure o gatilho de condição:
1. Selecione Ausência de métrica como o tipo de condição.
2. Opcional: atualize o menu Alert trigger, que tem os seguintes valores:
  - Qualquer violação de série temporal: configuração padrão. Qualquer série temporal com dados ausentes para todo o período de ausência do acionador faz com que a condição seja atendida.
  - Percent of time series violates (Uma porcentagem de séries temporais viola): uma porcentagem de séries temporais precisa ter dados ausentes durante todo o período de ausência do acionador antes que a condição seja atendida. Por exemplo, você pode receber uma notificação quando 50% das séries temporais monitoradas não têm dados para todo o período de ausência do acionador.
  - Number of time series violates: um número específico de séries temporais precisa ter dados ausentes durante todo o período de ausência do acionador antes que a condição seja atendida. Por exemplo, você pode receber uma notificação quando 32 das séries temporais monitoradas não tiverem dados para todo o tempo de ausência do acionador.
  - Todas as séries temporais violam: todas as séries temporais precisam ter dados ausentes por todo o tempo de ausência do acionador antes que a condição seja atendida.
  Para saber mais sobre os intervalos que o monitoramento usa para alinhar e medir dados de séries temporais, consulte Períodos de alinhamento e janelas de novo teste.
3. Especifique por quanto tempo os dados de métrica precisam estar ausentes antes que o monitoramento notifique você usando o campo Tempo de ausência do acionador.
4. Clique em Próxima.
Opcional: crie uma política de alertas com várias condições.

A maioria das políticas monitora um único tipo de métrica. Por exemplo, uma política pode monitorar o número de bytes gravados em uma instância de VM. Quando você quiser monitorar vários tipos de métricas, crie uma política com várias condições. Cada condição monitora um tipo de métrica. Depois de criar as condições, especifique como elas são combinadas. Para mais informações, consulte Políticas com várias condições.

Para criar uma política de alertas com várias condições, faça o seguinte:
1. Para cada condição adicional, clique em Adicionar condição de alerta e configure essa condição.
2. Clique em Próxima e configure como as condições são combinadas.
3. Clique em Próxima para avançar para a configuração de notificações e documentação.
Configure as notificações:
1. Abra o menu Notificações e nome e selecione seus canais de notificação. Para fins de redundância, recomendamos que você adicione a uma política de alertas vários tipos de canais de notificação. Para saber mais, consulte Gerenciar canais de notificação.
2. Opcional: para receber uma notificação quando um incidente for fechado, selecione Notificar sobre o fechamento de incidentes. Por padrão, quando você cria uma política de alertas com o Console do Google Cloud, uma notificação é enviada apenas quando um incidente é criado.
3. Opcional: para mudar o tempo de espera do Monitoring antes de fechar um incidente quando os dados param de chegar, selecione uma opção no menu Duração do fechamento automático de incidentes. Por padrão, quando os dados param de chegar, o Monitoring aguarda sete dias antes de fechar um incidente aberto.
4. Selecione uma opção no menu Nível de gravidade da política. Os incidentes e as notificações mostram o nível de gravidade.
5. Opcional: para adicionar rótulos personalizados à política de alertas, na seção Rótulos do usuário da política, faça o seguinte:
  1. Clique em Adicionar rótulo e, no campo Chave, insira um nome para o rótulo. Os nomes dos rótulos precisam começar com uma letra minúscula e podem conter letras minúsculas, números, sublinhados e traços. Por exemplo, insira severity.
  2. Clique em Valor e insira um valor para o rótulo. Os valores de rótulo podem ter letras minúsculas, números, sublinhados e traços. Por exemplo, insira critical.
  Para saber como usar os rótulos de políticas para gerenciar as notificações, consulte Anexar rótulos a incidentes.
Opcional: na seção Documentação, insira o conteúdo que você quer incluir na notificação.

Para formatar a documentação, use texto simples, Markdown e variáveis. Também é possível incluir links para ajudar os usuários a depurar o incidente, como links para playbooks internos, Google Cloud painéis e páginas externas. Por exemplo, o modelo de documentação a seguir descreve um incidente de utilização de CPU para um recurso gce_instance e inclui várias variáveis para referenciar a política de alertas e os recursos REST de condição. O modelo de documentação direciona os leitores para páginas externas para ajudar na depuração.

Quando as notificações são criadas, o Monitoring substitui as variáveis da documentação pelos valores. Os valores substituem as variáveis somente nas notificações. O painel de visualização e outros lugares no console do Google Cloud mostram apenas a formatação Markdown.
Visualizar
```
## CPU utilization exceeded

### Summary

The ${metric.display_name} of the ${resource.type}
${resource.label.instance_id} in the project ${resource.project} has
exceeded 90% for over 15 minutes.

### Additional resource information

Condition resource name: ${condition.name}  
Alerting policy resource name: ${policy.name}  

### Troubleshooting and Debug References

Repository with debug scripts: example.com  
Internal troubleshooting guide: example.com  
${resource.type} dashboard: example.com
```
Formatar na notificação
Para mais informações, consulte Anexar documentação definida pelo usuário às notificações e Como usar os controles de canal.
Clique em Nome e digite um nome para a política de alertas.
Clique em Criar política.

Os filtros garantem que somente séries temporais que atendam a algum conjunto de critérios sejam monitoradas. Ao aplicar filtros, você pode reduzir o número de linhas no gráfico, o que pode melhorar a performance dele. Também é possível reduzir a quantidade de dados monitorados aplicando a agregação. Os filtros garantem que somente séries temporais que atendam a algum conjunto de critérios sejam usadas. Quando você aplica filtros, há menos séries temporais para avaliar, o que pode melhorar a performance do alerta.

Um filtro é composto por um rótulo, um comparador e um valor. Por exemplo, para corresponder a todas as séries temporais em que o rótulo zone começa com "us-central1", você pode usar o filtro zone=~"us-central1.*", que usa uma expressão regular para realizar a comparação.

Ao filtrar pelo ID do projeto ou pelo contêiner de recursos, use o operador de igualdade, (=). Ao filtrar por outros rótulos, você pode usar qualquer comparador compatível. Normalmente, é possível filtrar rótulos de métricas e recursos, além de grupos de recursos.

Quando você fornece vários critérios de filtragem, somente as séries temporais que atendem a todos os critérios são monitoradas.

Para adicionar um filtro, clique em Adicionar filtro, preencha a caixa de diálogo e clique em Concluído. Na caixa de diálogo, use o campo Filtro para selecionar o critério de filtragem, o operador de comparação e, em seguida, o valor. Cada linha na tabela a seguir lista um operador de comparação, o significado dele e um exemplo:

Operador	Significado	Exemplo
`=`	Igualdade	`resource.labels.zone = "us-central1-a"`
`!=`	Desigualdade	`resource.labels.zone != "us-central1-a"`
`=~`	Igualdade entre expressão regular2	`monitoring.regex.full_match("^us.*")`
`!=~`	Desigualdade de expressão regular2	`monitoring.regex.full_match("^us.*")`
`starts_with`	O valor começa com	`resource.labels.zone = starts_with("us")`
`ends_with`	O valor termina com	`resource.labels.zone = ends_with("b")`
`has_substring`	O valor contém	`resource.labels.zone = has_substring("east")`
`one_of`	Uma	`resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")`
`!starts_with`	O valor não começa com	`resource.labels.zone != starts_with("us")`
`!ends_with`	O valor não termina com	`resource.labels.zone != ends_with("b")`
`!has_substring`	O valor não contém	`resource.labels.zone != has_substring("east")`
`!one_of`	O valor não é um dos	`resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")`

Criar políticas de alertas de ausência de métrica

Antes de começar

Criar política de alertas

Visualizar

Formatar na notificação

Filtrar a série temporal selecionada