Visão geral de alerta

Neste documento, descrevemos como receber notificações quando seu aplicativo falhar ou quando o desempenho dele não atende aos critérios definidos.

Como os alertas funcionam

O processo de alertas do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer receber alertas e notificações sobre um incidente. A política de alertas pode monitorar dados de série temporal armazenados pelo Cloud Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados atendem à condição da política de alertas, o Cloud Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitorado e quando as condições foram atendidas. Essas informações podem ajudar você a resolver os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe as notificações quando o Cloud Monitoring cria um incidente. Por exemplo, é possível configurar um canal de notificação para enviar um e-mail a my-support-team@example.com e postar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar dois tipos de dados:

  • Dados de série temporal, também chamados de dados de métricas, que são armazenados pelo Monitoring. Esses tipos de políticas são chamados de políticas de alertas baseadas em métricas.

    Para aprender a configurar uma política de alertas com base em métricas, confira o Guia de início rápido do Compute Engine.

  • Dados de registro armazenados pelo Cloud Logging. Esses tipos de políticas são chamados de políticas de alertas com base em registros. As políticas de alertas com base em registros notificam você quando uma mensagem específica aparece nos registros.

    Este documento se concentra em políticas de alertas com base em métricas, com informações gerais sobre políticas de alertas com base em registros quando relevantes. Para informações detalhadas sobre políticas de alertas com base em registros, consulte Monitorar seus registros.

O processo de alerta ajuda você a responder a problemas quando o desempenho de um aplicativo não atende aos valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora você espere que a latência da resposta HTTP varie, é recomendável que a equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. É possível criar uma política de alertas com base em métricas que monitore a métrica de latência da resposta HTTP do aplicativo. Se a latência da resposta for maior que dois segundos por pelo menos cinco minutos, o Monitoring criará um incidente e enviará notificações por e-mail para sua equipe de suporte.

Como criar uma política de alertas

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alertas pré-configuradas ativando os alertas recomendados de integrações ou determinadas páginas no console do Google Cloud. Também é possível configurar uma nova política de alertas usando o Console do Google Cloud, a API Cloud Monitoring, a Google Cloud CLI e o Terraform.

Usar integrações e alertas recomendados

O Cloud Monitoring fornece pacotes pré-criados para permitir a criação de políticas de alertas para serviços do Google Cloud e integrações de terceiros. Os pacotes incluem políticas de alertas recomendadas, painéis de amostra e as principais métricas do serviço. Esses pacotes estão disponíveis para serviços do Google Cloud, como Google Kubernetes Engine, Compute Engine e Cloud SQL, e integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, é possível ativar os alertas recomendados dele. Ao ativar o alerta, você fornece seus canais de notificação e usa a configuração padrão do alerta ou ajusta a configuração conforme necessário. A política de alertas começa a monitorar o destino imediatamente, sem necessidade de nenhuma outra entrada do usuário.

As políticas de alertas recomendadas são úteis quando você implantou um novo serviço e quer alertar sobre métricas importantes. Por exemplo, o pacote de integração do CloudSQL vem com alertas recomendados para instâncias com falha e transações lentas:

Dois dos alertas recomendados para o pacote de integração do CloudSQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Usar o Cloud Monitoring.

Se você quiser criar uma política de alertas e escolher o tipo de condição com outros componentes, como tipo de métrica e série temporal, use o Cloud Monitoring. A tabela a seguir lista os diferentes tipos de condições que podem ser usadas ao criar uma política de alertas.

Tipo de condição Descrição Exemplo
Condição de limite de métrica

Condições de limite de métrica, acionadas quando os valores de uma métrica são maiores ou menores que o limite para uma janela de duração específica.

Para mais informações, acesse Criar políticas de alertas de limite de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie um alerta quando a latência do recurso for de 500 ms ou superior para cinco verificações de tempo de atividade consecutivas ao longo de 10 minutos.
Condição de ausência de métrica

Condições de ausência de métrica, acionadas quando uma série temporal monitorada não tem dados em uma janela de duração específica. A janela de duração é de até 24 horas se você criar a condição no console do Google Cloud ou 24,5 horas na API Cloud Monitoring.

Para mais informações, consulte Criar políticas de alertas de ausência de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso não responder a nenhuma solicitação HTTP em cinco minutos.
Condição prevista de valor de métrica

As condições previstas de valor de métrica são acionadas quando a política de alertas prevê que o limite será violado na próxima janela de previsão. A janela de previsão pode variar de 1 hora a 7 dias.

Para mais informações, consulte Criar políticas de alertas de valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso provavelmente atingir 80% do espaço em disco nas próximas 24 horas.
Condição com base em registros

Condições de alerta com base em registros: acionadas quando a política de alertas detecta que uma métrica com base em registros corresponde aos critérios da política de alertas. As métricas com base em registros são derivadas do conteúdo das entradas de registro. Por exemplo, é possível usar uma métrica com base em registros para contar o número de entradas que contêm uma mensagem específica ou para extrair informações de latência gravadas nas entradas.

Para mais informações, consulte Configurar alertas com base em registros e Criar um alerta com base em registros usando a API Monitoring.

Você quer uma política de alertas que abra um incidente com a equipe de suporte quando o projeto tiver pelo menos 50 entradas de registro com um message contendo product_ids=['tier_1_support', 'tier_2_support'].

Componentes da política de alerta

Cada política de alertas tem os seguintes componentes:

  • Uma condição que descreve quando um recurso ou um grupo de recursos está em um estado que exige resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e métodos de agregação de dados, como janelas de lookback, filtros e groupby. Suas condições podem monitorar uma única métrica, várias ou uma proporção de métricas. Também é possível usar linguagens de consulta como PromQL e Monitoring Query Language (MQL) para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política de alertas será pré-preenchida.

  • Uma lista de canais de notificação que descrevem quem notificar quando uma ação for necessária. Para mais informações, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece nas páginas de notificações e incidentes. É possível configurar a linha de assunto de uma notificação e adicionar informações úteis ao corpo da notificação. Por exemplo, é possível configurar a notificação para exibir links para playbooks internos ou páginas do Google Cloud, como painéis personalizados. Para mais informações sobre a documentação, incluindo exemplos, consulte Anotação de alertas com documentação definida pelo usuário.

Linguagens de consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação de métricas. O Cloud Monitoring é compatível com os seguintes tipos de consulta:

  • Com os alertas do PromQL, é possível configurar políticas de alertas para usar a linguagem de consulta do Prometheus. As consultas do PromQL podem usar qualquer tipo de expressão válida da linguagem de consulta do Prometheus, como combinações de métricas, proporções e limites de escalonamento. Os alertas do PromQL também permitem a execução de alertas totalmente baseada no Google Cloud CLI, o que remove dependências na infraestrutura de alertas externa. Para mais informações, consulte PromQL no Cloud Monitoring e Políticas de alertas com PromQL.

  • A linguagem de consulta do Monitoring (MQL, na sigla em inglês) é uma interface expressiva e baseada em texto que permite recuperar, filtrar e manipular dados de séries temporais. É possível criar políticas de alertas com condições que incluam uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta do Monitoring e Políticas de alertas com o MQL.

  • Com os filtros do Monitoring, é possível configurar políticas de alertas para usar proporções de métricas com base em filtros. As políticas de alertas com base em filtro não podem ser visualizadas nem modificadas no console do Google Cloud. Para ver um exemplo de uma política que usa filtros do Monitoring, consulte Proporção da métrica.

Gerenciar políticas de alertas e incidentes

Depois que uma política de alertas é ativada, o Cloud Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições apenas para determinados períodos. Se você quiser desativar a política de alertas por um determinado período, crie um adiamento.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política com base em métricas não são mais atendidas, ele fechará automaticamente o incidente e enviará uma notificação sobre a interdição.

Custos associados às políticas de alertas

Para informações sobre preços, consulte Preços do pacote de operações do Google Cloud.

A seguir