Informações gerais sobre alertas

Neste documento, descrevemos como receber notificações quando o aplicativo falhar ou quando o desempenho dele não atende aos critérios definidos.

Como os alertas funcionam

O processo de alertas do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer receber alertas e notificações sobre um incidente. A política de alertas pode monitorar dados de séries temporais armazenados pelo Cloud Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados atendem à condição da política de alertas, o Cloud Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitorado e quando as condições foram atendidas. Essas informações podem ajudar a solucionar os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe as notificações quando o Cloud Monitoring cria um incidente. Por exemplo, é possível configurar um canal de notificação para enviar um e-mail a my-support-team@example.com e postar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar dois tipos de dados:

  • Dados de série temporal, também chamados de dados de métricas, que são armazenados pelo Monitoring. Esses tipos de políticas são chamadas de políticas de alertas com base em métricas.

    Para saber como configurar uma política de alertas com base em métricas, confira o Guia de início rápido do Compute Engine.

  • Dados de registro armazenados pelo Cloud Logging. Esses tipos de políticas são chamadas de políticas de alertas com base em registros. As políticas de alertas com base em registros notificam quando uma mensagem específica aparece nos registros.

    Este documento se concentra em políticas de alertas com base em métricas, com informações gerais sobre políticas de alertas com base em registros quando relevantes. Para informações detalhadas sobre políticas de alertas com base em registros, consulte Monitorar seus registros.

O processo de alerta ajuda você a responder a problemas quando o desempenho de um aplicativo não atende aos valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora a latência da resposta HTTP varie, convém que a equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. É possível criar uma política de alertas com base em métricas que monitore a métrica de latência de resposta HTTP do aplicativo. Se a latência de resposta for superior a dois segundos por pelo menos cinco minutos, o Monitoring criará um incidente e enviará notificações por e-mail para a equipe de suporte.

Como criar uma política de alertas

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alertas pré-configuradas ativando os alertas recomendados de integrações ou de determinadas páginas no console do Google Cloud. Também é possível configurar uma nova política de alertas usando o Console do Google Cloud, a API Cloud Monitoring, a Google Cloud CLI e o Terraform.

Usar integrações e alertas recomendados

O Cloud Monitoring fornece pacotes pré-criados para permitir que você crie políticas de alertas para seus serviços do Google Cloud e integrações de terceiros. Os pacotes incluem políticas de alertas recomendadas, painéis de amostra e métricas principais do serviço. Esses pacotes estão disponíveis para serviços do Google Cloud, como Google Kubernetes Engine, Compute Engine e Cloud SQL, e integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, é possível ativar os alertas recomendados dele. Ao ativar o alerta, você fornece seus canais de notificação e usa a configuração padrão do alerta ou ajusta a configuração conforme necessário. A política de alertas começa a monitorar o objetivo imediatamente, sem necessidade de qualquer outra entrada do usuário.

As políticas de alertas recomendadas são úteis quando você implantou um novo serviço e quer alertar sobre métricas importantes. Por exemplo, o pacote de integração do CloudSQL vem com alertas recomendados para instâncias com falha e transações lentas:

Dois dos alertas recomendados para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Usar o Cloud Monitoring.

Se você quiser criar uma política de alertas e escolher o tipo de condição com outros componentes, como tipo de métrica e série temporal, use o Cloud Monitoring. A tabela a seguir lista os diferentes tipos de condições que podem ser usadas ao criar uma política de alertas.

Tipo de condição Descrição Exemplo
Condição de limite de métrica

Condições de limite de métrica, acionadas quando os valores de uma métrica são maiores ou menores que o limite para uma janela de duração específica.

Para mais informações, consulte Criar políticas de alertas de limite de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie um alerta quando a latência do recurso for de 500 ms ou superior por cinco verificações de tempo de atividade consecutivas ao longo de 10 minutos.
Condição de ausência de métrica

Condições de ausência de métrica, acionadas quando uma série temporal monitorada não tem dados em uma janela de duração específica. A janela de duração é de até 24 horas se você criar a condição no console do Google Cloud ou de 24,5 horas na API Cloud Monitoring.

Para mais informações, consulte Criar políticas de alertas de ausência de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso não responde a nenhuma solicitação HTTP durante cinco minutos.
Condição prevista do valor da métrica

Condições previstas de valor de métrica, acionadas quando a política de alertas prevê que o limite será violado dentro da próxima janela de previsão. A janela de previsão pode variar de uma hora a sete dias.

Para mais informações, consulte Criar políticas de alertas com valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso provavelmente atingir 80% do espaço em disco nas próximas 24 horas.
Condição com base em registros

Condições de alerta com base em registros são acionadas quando a política de alertas detecta que uma métrica com base em registros corresponde aos critérios da política de alertas. As métricas com base em registros são derivadas do conteúdo das entradas de registro. Por exemplo, é possível usar uma métrica com base em registros para contar o número de entradas que contêm uma mensagem específica ou para extrair informações de latência gravadas nas entradas.

Saiba mais em Configurar alertas com base em registros e Criar um alerta com base em registros usando a API Monitoring.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando o projeto tiver pelo menos 50 entradas de registro com um message contendo product_ids=['tier_1_support', 'tier_2_support'].

Componentes da política de alerta

Cada política de alertas tem os componentes a seguir:

  • Uma condição que descreve quando um recurso ou grupo de recursos está em um estado que exige resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e métodos de agregação de dados, como janelas de lookback, filtros e groupby. Suas condições podem monitorar uma única métrica, várias métricas ou uma proporção de métricas. Também é possível usar linguagens de consulta, como PromQL e Monitoring Query Language (MQL), para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política será pré-preenchida.

  • Uma lista de canais de notificação que descrevem quem notificar quando uma ação for necessária. Para saber mais, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece nas páginas de notificações e incidentes. Você pode configurar a linha de assunto de uma notificação e pode adicionar informações úteis ao corpo da notificação. Por exemplo, é possível configurar a notificação para exibir links para playbooks internos ou para páginas do Google Cloud, como painéis personalizados. Para mais informações sobre a documentação, incluindo exemplos, consulte Anotar alertas com documentação definida pelo usuário.

Linguagens de consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação de métricas. O Cloud Monitoring é compatível com os seguintes tipos de consulta:

  • Os alertas do PromQL permitem que você configure políticas de alertas para usar a linguagem de consulta do Prometheus. Suas consultas do PromQL podem usar qualquer tipo de expressão válida da linguagem de consulta do Prometheus, como combinações de métricas, proporções e limites de escalonamento. Os alertas do PromQL também permitem a execução de alertas totalmente baseada na Google Cloud CLI, o que remove dependências na infraestrutura de alertas externos. Para mais informações, consulte PromQL no Cloud Monitoring e Políticas de alertas com PromQL.

  • A linguagem de consulta do Monitoring (MQL, na sigla em inglês) é uma interface expressiva e baseada em texto que permite recuperar, filtrar e manipular dados de séries temporais. É possível criar políticas de alertas com condições que incluem uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta do Monitoring e Políticas de alertas com MQL.

  • Com os filtros do Monitoring, é possível configurar políticas de alertas para usar proporções de métricas baseadas em filtro. As políticas de alertas baseadas em filtro não podem ser visualizadas ou modificadas no console do Google Cloud. Para ver um exemplo de uma política que usa filtros do Monitoring, consulte Proporção da métrica.

Gerenciar políticas de alertas e incidentes

Depois que uma política de alertas é ativada, o Cloud Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições apenas para determinados períodos. Para desativar a política de alertas por um determinado período, crie um adiamento.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política baseada em métricas não são mais atendidas, ele fechará automaticamente o incidente e enviará uma notificação sobre a interdição.

Preços

Em geral, as métricas de sistema do Cloud Monitoring são gratuitas, já as métricas de sistemas, agentes ou aplicativos externos não. As métricas faturáveis são cobradas pelo número de bytes ou de amostras ingeridas.

Para mais informações sobre os preços do Cloud Monitoring, consulte os seguintes documentos:

Para informações sobre como monitorar o número de períodos ou registros de trace que são ingeridos ou como ser notificado quando um conteúdo específico for incluído em uma entrada de registro, consulte os seguintes artigos:

A seguir