Informações gerais sobre alertas

Neste documento, descrevemos como receber notificações quando o aplicativo falhar ou quando o desempenho dele não atende aos critérios definidos.

Como os alertas funcionam

O processo de alertas do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer receber alertas e notificações sobre um incidente. A política de alertas pode monitorar dados de séries temporais armazenados pelo Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados atendem à condição da política de alertas, o Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitorado e quando as condições foram atendidas. Essas informações podem ajudar a solucionar os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe notificações quando o Monitoring cria um incidente. Por exemplo, é possível configurar um canal de notificação para enviar um e-mail a my-support-team@example.com e postar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar dois tipos de dados:

  • Dados de série temporal, também chamados de dados de métricas, que são armazenados pelo Monitoring. Esses tipos de políticas são chamadas de políticas de alertas com base em métricas.

    Para saber como configurar uma política de alertas com base em métricas, confira o Guia de início rápido do Compute Engine.

  • Dados de registro armazenados pelo Cloud Logging. Esses tipos de políticas são chamadas de políticas de alertas com base em registros. As políticas de alertas com base em registros notificam quando uma mensagem específica aparece nos registros.

    Este documento se concentra em políticas de alertas com base em métricas, com informações gerais sobre políticas de alertas com base em registros quando relevantes. Para informações detalhadas sobre políticas de alertas com base em registros, consulte Monitorar seus registros.

O processo de alerta ajuda você a responder a problemas quando o desempenho de um aplicativo não atende aos valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora a latência da resposta HTTP varie, convém que a equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. É possível criar uma política de alertas com base em métricas que monitore a métrica de latência de resposta HTTP do aplicativo. Se a latência de resposta for superior a dois segundos por pelo menos cinco minutos, o Monitoring criará um incidente e enviará notificações por e-mail para a equipe de suporte.

Como criar uma política de alertas

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alertas pré-configuradas ativando os alertas recomendados de integrações ou de determinadas páginas no console do Google Cloud. Também é possível configurar uma nova política de alertas usando o Console do Google Cloud, a API Cloud Monitoring, a Google Cloud CLI e o Terraform.

Usar integrações e políticas de alertas recomendadas

O Monitoring fornece pacotes pré-criados para permitir que você crie políticas de alertas para seus serviços do Google Cloud e integrações de terceiros. Os pacotes incluem políticas de alertas recomendadas, painéis de amostra e métricas principais do serviço. Esses pacotes estão disponíveis para serviços do Google Cloud, como Google Kubernetes Engine, Compute Engine e Cloud SQL, e integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, é possível ativar as políticas de alertas recomendadas para ele. Ao ativar uma política de alertas recomendada, você configura o canal de notificação e, opcionalmente, modifica outros valores. Após a configuração, a política de alertas começa a monitorar o destino imediatamente, sem a necessidade de mais entradas do usuário.

As políticas de alertas recomendadas são úteis quando você implantou um novo serviço e quer alertar sobre métricas importantes. Por exemplo, o pacote de integração do CloudSQL vem com alertas recomendados para instâncias com falha e transações lentas:

Dois dos alertas recomendados para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Usar o Cloud Monitoring.

Se você quiser criar uma política de alertas e escolher o tipo de condição com outros componentes, como tipo de métrica e série temporal, use o Monitoring. A tabela a seguir lista os diferentes tipos de condições que podem ser usadas ao criar uma política de alertas.

Tipo de condição Descrição Exemplo
Condição de limite de métrica

As condições de limite de métrica são atendidas quando os valores de uma métrica são maiores ou menores que o limite para uma janela de duração específica.

Para mais informações, consulte Criar políticas de alertas de limite de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie uma notificação quando a latência da resposta for de 500 ms ou superior por cinco verificações de tempo de atividade consecutivas ao longo de 10 minutos.
Condição de ausência de métrica

As condições de ausência de métrica são atendidas quando uma série temporal monitorada não tem dados para uma janela de duração específica. A janela de duração é de até 24 horas se você criar a condição no console do Google Cloud ou de 24,5 horas na API Cloud Monitoring.

Para mais informações, consulte Criar políticas de alertas de ausência de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso não responde a nenhuma solicitação HTTP durante cinco minutos.
Condição prevista do valor da métrica

As condições previstas de valor de métrica são atendidas quando a política de alertas prevê que o limite será violado dentro da próxima janela de previsão. A janela de previsão pode variar de uma hora a sete dias.

Para mais informações, consulte Criar políticas de alertas com valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso provavelmente atingir 80% do espaço em disco nas próximas 24 horas.
Condição com base em registros

Uma condição em uma política de alertas com base em registros é atendida quando a política de alertas detecta que uma métrica com base em registros corresponde aos critérios da política de alertas. As métricas com base em registros são derivadas do conteúdo das entradas de registro. Por exemplo, é possível usar uma métrica com base em registros para contar o número de entradas de registro que contêm uma mensagem específica ou para extrair informações de latência gravadas nas entradas.

Para mais informações, consulte Configurar alertas com base em registros e Criar um alerta com base em registros usando a API Monitoring.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando o projeto tiver pelo menos 50 entradas de registro com um message contendo product_ids=['tier_1_support', 'tier_2_support'].

Componentes da política de alerta

Cada política de alertas tem os componentes a seguir:

  • Uma condição que descreve quando um recurso ou grupo de recursos está em um estado que exige resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e métodos de agregação de dados, como janelas de lookback, filtros e groupby. Suas condições podem monitorar uma única métrica, várias métricas ou uma proporção de métricas. Também é possível usar linguagens de consulta, como PromQL e Monitoring Query Language (MQL), para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política será pré-preenchida.

  • Uma lista de canais de notificação que descrevem quem notificar quando uma ação for necessária. Para saber mais, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece nas páginas de notificações e incidentes. Você pode configurar a linha de assunto de uma notificação e pode adicionar informações úteis ao corpo da notificação. Por exemplo, é possível configurar a notificação para exibir links para playbooks internos ou para páginas do Google Cloud, como painéis personalizados. Para mais informações sobre a documentação, incluindo exemplos, consulte Anotar alertas com documentação definida pelo usuário.

Linguagens de consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação de métricas. O Monitoring é compatível com os seguintes tipos de consulta:

  • A linguagem de consulta do Prometheus (PromQL, na sigla em inglês) é uma linguagem de consulta funcional usada para avaliar dados de série temporal em tempo real. É possível configurar condições da política de alertas para incluir uma consulta PromQL nas condições. Suas consultas do PromQL podem usar qualquer expressão válida, como combinações de métricas, proporções e limites de escalonamento. Ao configurar políticas de alertas com uma condição baseada em PromQL no Google Cloud, é possível reduzir as dependências na infraestrutura de alertas externa. Para mais informações, consulte PromQL no Cloud Monitoring e Políticas de alertas com PromQL.

  • A linguagem de consulta do Monitoring (MQL, na sigla em inglês) é uma interface expressiva e baseada em texto que permite recuperar, filtrar e manipular dados de séries temporais. É possível criar políticas de alertas com condições que incluem uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta do Monitoring e Políticas de alertas com MQL.

  • Com os filtros do Monitoring, é possível configurar políticas de alertas para usar proporções de métricas baseadas em filtro. As políticas de alertas baseadas em filtro não podem ser visualizadas ou modificadas no console do Google Cloud. Para ver um exemplo de uma política que usa filtros do Monitoring, consulte Proporção da métrica.

Gerenciar políticas de alertas e incidentes

Depois que uma política de alertas é ativada, o Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições apenas para determinados períodos. Para desativar a política de alertas por um determinado período, crie um adiamento.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política baseada em métricas não são mais atendidas, ele fechará automaticamente o incidente e enviará uma notificação sobre a interdição.

Preços

Em geral, as métricas de sistema do Cloud Monitoring são gratuitas, já as métricas de sistemas, agentes ou aplicativos externos não. As métricas faturáveis são cobradas pelo número de bytes ou de amostras ingeridas.

Para mais informações sobre os preços do Cloud Monitoring, consulte os seguintes documentos:

Para informações sobre como monitorar o número de períodos de trace ou registros que são ingeridos ou como ser notificado quando um conteúdo específico é incluído em uma entrada de registro, consulte os seguintes documentos:

A seguir