Visão geral de alerta

Neste documento, descrevemos como receber notificações quando seu aplicativo falhar ou quando o desempenho de um aplicativo não atender aos critérios definidos.

Como os alertas funcionam

O processo de alertas do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer ser alertado e como quer ser notificado sobre um incidente. A política de alertas pode monitorar dados de séries temporais armazenados pelo Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados atendem à condição da política de alertas, o Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitorado e de quando as condições foram atendidas. Essas informações podem ajudar você a solucionar os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe notificações quando o Monitoring cria um incidente. Por exemplo, é possível configurar um canal de notificação para enviar por e-mail my-support-team@example.com e publicar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar dois tipos de dados:

  • Dados de série temporal, também chamados de dados de métricas, que são armazenados pelo Monitoring. Esses tipos de políticas são chamados de políticas de alertas baseadas em métricas.

    Para saber como configurar uma política de alertas com base em métricas, consulte o Guia de início rápido do Compute Engine.

  • Dados de registro armazenados pelo Cloud Logging. Esses tipos de políticas são chamados de políticas de alertas com base em registros. As políticas de alertas com base em registros notificam você quando uma mensagem específica aparece nos registros.

    Este documento se concentra em políticas de alertas com base em métricas, com informações gerais sobre políticas de alertas com base em registros, quando relevantes. Para informações detalhadas sobre políticas de alertas com base em registros, consulte Monitorar seus registros.

O processo de alerta ajuda a responder a problemas quando o desempenho de um aplicativo não atende aos valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora você espere que a latência de resposta HTTP oscile, você quer que sua equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. É possível criar uma política de alertas com base em métricas que monitore a métrica de latência de resposta HTTP do aplicativo. Se a latência de resposta for superior a dois segundos durante pelo menos cinco minutos, o Monitoring criará um incidente e enviará notificações por e-mail para sua equipe de suporte.

Como criar uma política de alertas

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alertas pré-configuradas ativando os alertas recomendados de integrações ou determinadas páginas no console do Google Cloud. Também é possível configurar uma nova política de alertas usando o console do Google Cloud, a API Cloud Monitoring, a Google Cloud CLI e o Terraform.

Usar integrações e políticas de alertas recomendadas

O Monitoring fornece pacotes pré-criados para permitir que você crie políticas de alertas para serviços do Google Cloud e integrações de terceiros. Os pacotes incluem políticas de alertas recomendadas, painéis de amostra e as principais métricas do serviço. Esses pacotes estão disponíveis para serviços do Google Cloud, como o Google Kubernetes Engine, Compute Engine e Cloud SQL, e para integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, é possível ativar as políticas de alertas recomendadas dele. Ao ativar uma política de alertas recomendada, você configura o canal de notificação dela e, opcionalmente, modifica outros valores. Após a configuração, a política de alertas começa a monitorar o destino imediatamente, sem necessidade de mais entradas do usuário.

As políticas de alertas recomendadas são úteis quando você implantou um novo serviço e quer alertar sobre métricas importantes. Por exemplo, o pacote de integração do Cloud SQL vem com as políticas de alertas recomendadas para instâncias com falha e transações lentas:

Duas das políticas de alertas recomendadas para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Usar o Cloud Monitoring.

Se você quiser criar uma política de alertas e escolher o tipo de condição dela com outros componentes, como tipo de métrica e série temporal, use o Monitoring. A tabela a seguir lista os diferentes tipos de condições que podem ser usadas ao criar uma política de alertas.

Tipo de condição Descrição Exemplo
Condição de limite de métrica

As condições de limite de métrica são atendidas quando os valores de uma métrica são maiores ou menores que o limite para uma janela de novo teste específica.

Para mais informações, consulte Criar políticas de alertas de limite de métricas e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie uma notificação quando a latência de resposta for de 500 ms ou maior durante cinco verificações de tempo de atividade consecutivas durante 10 minutos.
Condição de ausência de métrica

As condições de ausência de métrica são atendidas quando uma série temporal monitorada não tem dados para uma janela específica de novo teste. A janela máxima de um novo teste é 23,5 horas.

Para mais informações, consulte Criar políticas de alertas de ausência de métricas e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso não responder a nenhuma solicitação HTTP em cinco minutos.
Condição do valor da métrica prevista

As condições de valor da métrica estimada são atendidas quando a política de alertas prevê que o limite será violado dentro da próxima janela de previsão. A janela de previsão pode variar de 1 hora a 7 dias.

Para mais informações, consulte Criar políticas de alertas com valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso provavelmente atingir 80% de uso do espaço em disco nas próximas 24 horas.
Condição com base em registros

Uma condição em uma política de alertas com base em registros é atendida quando ela detecta que uma métrica com base em registros corresponde aos critérios da política de alertas. As métricas com base em registros são derivadas do conteúdo das entradas de registro. Por exemplo, é possível usar uma métrica com base em registros para contar o número de entradas de registro que contêm uma mensagem específica ou para extrair informações de latência gravadas nas entradas.

Para mais informações, consulte Configurar políticas de alertas com base em registros e Criar uma política de alertas com base em registros usando a API Cloud Monitoring.

Você quer uma política de alertas que abra um incidente com a equipe de suporte quando o projeto tiver pelo menos 50 entradas de registro com um message que contenha product_ids=['tier_1_support', 'tier_2_support']

Componentes da política de alerta

Cada política de alertas tem os seguintes componentes:

  • Uma condição que descreve quando um recurso ou grupo de recursos está em um estado que exige uma resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e métodos de agregação de dados, como filtros e groupby. Suas condições podem monitorar uma única métrica, várias métricas ou uma proporção de métricas. Também é possível usar linguagens de consulta como PromQL e linguagem de consulta do Monitoring (MQL, na sigla em inglês) para incluir expressões complexas como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política de alertas será pré-preenchida.

  • Uma lista de canais de notificação que descrevem quem notificar quando uma ação é necessária. Para mais informações, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece em notificações e páginas de incidentes. É possível configurar a linha de assunto de uma notificação e adicionar informações úteis ao corpo da notificação. Por exemplo, é possível configurar a notificação para exibir links para playbooks internos ou para páginas do Google Cloud, como painéis personalizados. Para mais informações sobre a documentação, incluindo exemplos, consulte Anotar incidentes com a documentação definida pelo usuário.

Linguagens de consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação da métrica. O Monitoring aceita os seguintes tipos de consulta:

  • A linguagem de consulta do Prometheus (PromQL) é uma linguagem de consulta funcional usada para avaliar dados de série temporal em tempo real. É possível configurar condições da política de alertas para incluir uma consulta PromQL nas condições. As consultas do PromQL podem usar qualquer expressão válida, como combinações de métricas, proporções e limites de escalonamento. Ao configurar políticas de alertas com uma condição baseada em PromQL no Google Cloud, é possível reduzir as dependências na infraestrutura de alertas externos. Para mais informações, consulte PromQL no Cloud Monitoring e Políticas de alertas com PromQL.

  • A linguagem de consulta do Monitoring (MQL, na sigla em inglês) é uma interface expressiva e baseada em texto que permite recuperar, filtrar e manipular dados de séries temporais. É possível criar políticas de alerta com condições que incluem uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta de monitoramento e Políticas de alertas com MQL.

  • Com os filtros de monitoramento, é possível configurar políticas de alertas para usar proporções de métricas As políticas de alertas com base em filtros não podem ser visualizadas ou modificadas no console do Google Cloud. Para conferir um exemplo de política que usa filtros do Monitoring, consulte Proporção da métrica.

Gerenciar incidentes e políticas de alertas

Depois que uma política de alertas é ativada, o Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições apenas por determinados períodos. Se você quiser desativar a política de alertas para um determinado período, crie um adiamento.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política com base em métricas não são mais atendidas, ele fechará o incidente automaticamente e enviará uma notificação sobre a interdição.

Preços

Em geral, as métricas do sistema do Cloud Monitoring são gratuitas, assim como as métricas de sistemas, agentes ou aplicativos externos. As métricas faturáveis são cobradas pelo número de bytes ou de amostras ingeridas.

Para mais informações sobre os preços do Cloud Monitoring, consulte os documentos a seguir:

Para informações sobre como monitorar o número de períodos de trace ou registros ingeridos ou como receber notificações quando um conteúdo específico for incluído em uma entrada de registro, consulte os seguintes documentos:

A seguir