Visão geral de alerta

Este documento descreve como você pode ser notificado quando seu aplicativo ou quando o desempenho de um aplicativo não atende ao objetivo critérios.

Como os alertas funcionam

O processo de alertas do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer receber alertas e notificações sobre um incidente. A política de alertas pode monitorar dados de séries temporais armazenados pelo Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados se encontram a condição da política de alertas, o Monitoring cria incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitoradas e quando as condições foram atendidas. Essas informações podem ajudar a resolver os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe notificações quando o Monitoring cria um incidente. Por exemplo, é possível configurar uma canal de notificação para enviar um e-mail a my-support-team@example.com e postar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar três tipos de dados:

  • Dados de série temporal, também chamados de dados de métrica, armazenados pelo Monitoring. Esses tipos de políticas são chamados de políticas de alertas com base em métricas.

    Para aprender a configurar uma política de alertas com base em métricas, tente o Guia de início rápido do Compute Engine.

  • Dados de registro armazenados pelo Cloud Logging. As políticas de alertas que avaliam entradas de registro individuais são chamadas de políticas de alertas com base em registros. As políticas de alertas baseadas em registros notificam você quando uma mensagem específica aparece nos registros. Para mais informações, consulte Monitorar seus registros.

  • Os resultados de uma consulta SQL são executados na Análise de dados de registros em relação à entrada de registro. e dados armazenados no Logging. As políticas de alertas que monitoram os resultados de uma consulta SQL são chamadas de políticas de alertas baseadas em SQL. Para mais informações, consulte Monitore os resultados da consulta SQL com uma política de alertas.

    As políticas de alertas baseadas em SQL estão em fase de pré-lançamento público.

O processo de alerta ajuda a responder a problemas quando o desempenho de um aplicativo não atende aos valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora você espere que a latência da resposta HTTP flutue, é importante que a equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. Você pode criar uma política de alertas com base em métricas que monitora a métrica de latência da resposta HTTP do aplicativo. Se a latência de resposta for maior que dois segundos por pelo menos cinco minutos, o Monitoring vai criar um incidente e enviar notificações por e-mail para sua equipe de suporte.

Como criar uma política de alertas

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alerta pré-configuradas ativando alertas recomendados de integrações ou de determinadas páginas no console do Google Cloud. Também é possível configurar uma nova política de alertas usando o Console do Google Cloud, API Cloud Monitoring, Google Cloud CLI e o Terraform.

Usar integrações e políticas de alertas recomendadas

O Monitoring fornece pacotes predefinidos para você criar políticas de alerta para seus serviços do Google Cloud e integrações de terceiros. Os pacotes incluem políticas de alerta recomendadas, painéis de exemplo e métricas importantes para o serviço. Esses pacotes estão disponíveis para serviços do Google Cloud, como o Google Kubernetes Engine, o Compute Engine e o Cloud SQL, e integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, você pode ativar as políticas de alerta recomendadas dele. Ao ativar uma política de alertas recomendada, você configura o canal de notificação e, opcionalmente, modifica outros valores. Após a configuração, a política de alerta começa a monitorar o alvo imediatamente, sem a necessidade de mais entradas do usuário.

As políticas de alertas recomendadas são úteis na implantação de um novo serviço e querem alertar sobre métricas importantes. Por exemplo, o pacote de integração do Cloud SQL vem com políticas de alerta recomendadas para instâncias com falha e transações lentas:

Duas das políticas de alerta recomendadas para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Criar novas políticas de alertas

É possível criar políticas de alertas para monitorar diferentes tipos de dados, dependendo das suas necessidades. As seções a seguir listam os diferentes tipos de dados que podem ser monitorados com políticas de alertas.

Monitorar dados de série temporal

Tipo de condição Descrição Exemplo
Condição de limite de métrica

As condições de limite de métrica são atendidas quando os valores de uma métrica são maiores ou menores que o limite para uma janela de novo teste específica.

Para mais informações, consulte Criar políticas de alertas de limite de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie uma notificação quando a latência da resposta for 500 ms ou mais em cinco verificações de tempo de atividade consecutivas em 10 minutos.
Condição de ausência de métrica

Condições de ausência de métrica, atendidas quando uma série temporal monitorada não tem dados para uma janela específica de novo teste. A janela máxima de um novo teste é 23,5 horas.

Para mais informações, consulte Criar políticas de alertas de ausência de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alerta que abra um incidente com sua equipe de suporte quando um recurso não responder a solicitações HTTP ao longo de cinco minutos.
Condição de valor de métrica previsto

As condições estimadas do valor da métrica são atendidas quando a política de alertas prevê que o limite será violado na próxima janela de previsão. A janela de previsão pode variar de 1 hora a 7 dias.

Para mais informações, consulte Criar políticas de alertas de valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com seu suporte quando é provável que um recurso atinja 80% de uso do espaço em disco nas próximas 24 horas.

Monitorar dados de entrada de registro

Para monitorar entradas de registro individuais, use uma política de alertas com base em registros. Uma condição em uma política de alertas com base em registros é atendida quando a política detecta que uma frase de uma entrada de registro corresponde aos critérios da política de alertas. Por exemplo, você quer uma política de alertas que abra um incidente com sua equipe de suporte quando a message de uma entrada de registro contiver product_ids=['tier_1_support', 'tier_2_support'].

Para mais informações, consulte Configurar políticas de alertas com base em registros na documentação de geração de registros.

Monitorar os resultados da consulta SQL

Para monitorar os resultados das consultas SQL, use uma política de alertas baseada em SQL. A condição de uma política de alertas baseada em SQL analisa periodicamente os dados de entrada de registro e criar incidentes quando a tabela de resultados da consulta atendem a determinados critérios. Esse tipo de política de alertas é útil quando você precisa de uma política de alertas que monitora agregações de dados ou padrões complexos em várias entradas de registro. Por exemplo, você quer receber uma notificação quando mais de 50 entradas de registro nos últimos 60 minutos tiverem uma gravidade de WARNING.

Para mais informações, consulte Monitorar os resultados da consulta SQL com uma política de alerta na documentação de registro.

Componentes da política de alerta

Cada política de alertas tem os seguintes componentes:

  • Uma condição que descreve quando um recurso ou um grupo de recursos está em um estado que exige uma resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e a agregação de dados métodos, como filtros e groupby. Suas condições podem monitorar uma única métrica, várias métricas ou uma proporção delas. Também é possível usar a linguagem de consulta do Prometheus (PromQL) para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política de alertas será preenchida automaticamente.

  • Uma lista de canais de notificação que descrevem quem será notificado quando a ação for necessária. Para mais informações, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece em notificações e páginas de incidentes. Você configurar a linha de assunto de uma notificação, além de adicionar informações úteis ao corpo da notificação. Por exemplo, você pode configurar a notificação para mostrar links para manuais internos ou para páginas do Google Cloud, como painéis personalizados. Para mais informações sobre a documentação, incluindo exemplos, consulte Anexar anotações a incidentes com documentação definida pelo usuário.

Idiomas da consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação das métricas. Monitoramento oferece suporte aos seguintes tipos de consulta:

  • A Linguagem de consulta do Prometheus (PromQL) é uma linguagem de consulta funcional usada para avaliar dados de série temporal em tempo real. É possível configurar políticas de alertas para incluir uma consulta PromQL nas condições. Suas consultas PromQL podem usar qualquer uma expressão válida, como combinações de métricas, proporções e limites de escalonamento. Ao configurar políticas de alertas com uma condição baseada em PromQL no Google Cloud, você pode reduzir as dependências da infraestrutura de alertas externos. Para mais informações, consulte PromQL no Cloud Monitoring e Políticas de alertas com o PromQL.

  • Os filtros de monitoramento permitem configurar políticas de alertas para usar proporções de métricas com base em filtros. Com base em filtro e as políticas de alertas não podem ser visualizadas nem modificadas no console do Google Cloud. Para conferir um exemplo de política que usa filtros do Monitoring, consulte Proporção da métrica.

  • A linguagem de consulta do Monitoring (MQL, na sigla em inglês) é uma interface expressiva e baseada em texto que permite recuperar, filtrar e manipular dados de série temporal. É possível criar políticas de alertas com condições que incluem uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta do Monitoring e Políticas de alertas com a MQL.

Gerenciar políticas de alertas e incidentes

Depois que uma política de alertas é ativada, o Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições apenas por determinados períodos. Se você quiser para desativar a política de alertas por um determinado período, crie uma Soneca.

Se um incidente está aberto e o Monitoring determina que o condições da política com base em métricas não forem mais atendidas, O Monitoring encerra automaticamente o incidente e envia uma notificação sobre a interdição.

Preços

Em geral, as métricas do sistema do Cloud Monitoring são gratuitas, e as métricas de sistemas, agentes ou aplicativos externos não são. As métricas faturáveis são faturado pelo número de bytes ou de amostras ingeridas.

Para mais informações sobre os preços do Cloud Monitoring, consulte os documentos a seguir:

Para saber como monitorar o número de períodos de trace ou registros que são ingeridos ou como receber notificações quando um conteúdo específico for incluído em uma entrada de registro, consulte os seguintes documentos:

A seguir