Vista geral dos alertas

Este documento descreve como pode receber uma notificação quando a sua aplicação falha ou quando o desempenho de uma aplicação não cumpre os critérios definidos.

Como funcionam os alertas

O processo de alerta do Cloud Monitoring contém três partes:

  • Uma política de alertas, que descreve as circunstâncias em que quer receber alertas e como quer receber notificações sobre um incidente. A política de alertas pode monitorizar dados de séries cronológicas armazenados pelo Monitoring ou registos armazenados pelo Cloud Logging. Quando esses dados cumprem a condição da política de alertas, o Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registo do tipo de dados que foram monitorizados e quando as condições foram cumpridas. Estas informações podem ajudar a resolver os problemas que causaram o incidente.

  • Um canal de notificação define como recebe notificações quando a monitorização cria um incidente. Por exemplo, pode configurar uma política de alertas para enviar um email my-support-team@example.com e publicar uma mensagem do Slack no canal #my-support-team. Uma política de alerta pode conter um ou mais canais de notificação.

As políticas de alerta podem avaliar três tipos de dados:

  • Dados de séries cronológicas, também denominados dados de métricas, que são armazenados pelo Monitoring. Estes tipos de políticas são denominados políticas de alerta baseadas em métricas.

    Para saber como configurar uma política de alertas baseada em métricas, experimente o Início rápido do Compute Engine.

  • Dados de entradas de registo armazenados pelo Cloud Logging. As políticas de alerta que avaliam as entradas de registo individuais são denominadas políticas de alerta baseadas em registos. As políticas de alerta baseadas em registos enviam-lhe uma notificação quando uma mensagem específica aparece nos seus registos. Para mais informações, consulte o artigo Monitorize os seus registos.

  • Os resultados de uma consulta SQL executada no Log Analytics em relação aos dados de entrada de registo armazenados no Logging. As políticas de alerta que monitorizam os resultados de uma consulta SQL são denominadas políticas de alerta baseadas em SQL. Para mais informações, consulte o artigo Monitorize os resultados das consultas SQL com uma política de alertas.

    As políticas de alerta baseadas em SQL estão em Pré-visualização pública.

O processo de alerta ajuda a responder a problemas quando o desempenho de uma aplicação não cumpre os valores aceitáveis. Por exemplo, implementa uma aplicação Web numa instância de máquina virtual (VM) do Compute Engine. Embora espere que a latência de resposta HTTP varie, quer que a sua equipa de apoio técnico responda quando a aplicação tiver uma latência elevada durante um período significativo. Pode criar uma política de alerta baseada em métricas que monitorize a métrica de latência de resposta HTTP da aplicação. Se a latência de resposta for superior a dois segundos durante, pelo menos, cinco minutos, a monitorização cria um incidente e envia notificações por email à sua equipa de apoio técnico.

Como criar uma política de alertas

Existem várias formas de criar uma política de alertas. Por exemplo, pode usar políticas de alerta pré-configuradas ativando alertas recomendados a partir de integrações ou de determinadas páginas na Google Cloud consola. Também pode configurar uma nova política de alertas através daGoogle Cloud consola, da API Cloud Monitoring, da CLI Google Cloud e do Terraform.

Use integrações e políticas de alerta recomendadas

A monitorização fornece pacotes pré-criados que lhe permitem criar políticas de alerta para os seus Google Cloud serviços e integrações de terceiros. Os pacotes incluem políticas de alerta recomendadas, painéis de controlo de exemplo e métricas importantes para o serviço. Estes pacotes estão disponíveis para Google Cloud serviços como o Google Kubernetes Engine, o Compute Engine e o Cloud SQL, e integrações comuns de terceiros, como o MongoDB, o Kafka e o Elasticsearch.

Quando instala um pacote, pode ativar as políticas de alerta recomendadas do pacote. Quando ativa uma política de alertas recomendada, configura o respetivo canal de notificação e, opcionalmente, modifica outros valores. Após a configuração, a política de alerta começa a monitorizar o respetivo destino imediatamente, sem necessidade de introdução de dados adicionais por parte do utilizador.

As políticas de alerta recomendadas são úteis quando implementou um novo serviço e quer receber alertas sobre métricas importantes. Por exemplo, o pacote de integração do Cloud SQL inclui políticas de alerta recomendadas para instâncias com falhas e transações lentas:

Duas das políticas de alerta recomendadas para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte o artigo Monitorização de aplicações de terceiros.

Crie novas políticas de alerta

Pode criar políticas de alerta para monitorizar diferentes tipos de dados, consoante as suas necessidades de alerta. As secções seguintes listam os diferentes tipos de dados que pode monitorizar com políticas de alerta.

Monitorize dados de intervalos temporais

Tipo de condição Descrição Exemplo
Condição de limite de métricas

As condições de limite de métricas são cumpridas quando os valores de uma métrica são superiores ou inferiores a um limite para um período de novo teste específico.

Para mais informações, consulte os artigos Crie políticas de alerta de limite métrico e Crie políticas de alerta através da API.

Quer uma política de alertas que envie uma notificação quando a latência de resposta for de 500 ms ou superior durante cinco verificações de tempo de atividade consecutivas ao longo de 10 minutos.
Condição de ausência de métricas

As condições de ausência de métricas são cumpridas quando uma série cronológica monitorizada não tem dados para um período de novo teste específico. O período de novo teste máximo é de 23,5 horas.

Para mais informações, consulte os artigos Crie políticas de alerta de ausência de métricas e Crie políticas de alerta através da API.

Quer uma política de alerta que abra um incidente com a sua equipa de apoio técnico quando um recurso não responde a pedidos HTTP durante cinco minutos.
Condição de valor da métrica prevista

As condições de valor da métrica previstas são cumpridas quando a política de alerta prevê que o limite vai ser violado no período de previsão seguinte. O período de previsão pode variar entre 1 hora e 7 dias.

Para mais informações, consulte os artigos Crie políticas de alerta de valor de métricas previstas e Crie políticas de alerta através da API.

Quer uma política de alerta que abra um incidente com a sua equipa de apoio técnico quando um recurso tiver probabilidade de atingir 80% de utilização do espaço em disco nas próximas 24 horas.

Monitorize os dados de entradas de registo

Para monitorizar entradas de registo individuais, use uma política de alertas baseada em registos. Uma condição numa política de alertas baseada em registos é cumprida quando a política de alertas deteta que uma expressão de uma entrada de registo corresponde aos critérios da política de alertas. Por exemplo, quer uma política de alertas que abra um incidente com a sua equipa de apoio técnico quando uma entrada de registo messagecontém product_ids=['tier_1_support', 'tier_2_support'].

Para mais informações, consulte o artigo Configure políticas de alerta baseadas em registos na documentação do Logging.

Monitorize os resultados das consultas SQL

Para monitorizar os resultados das consultas SQL, use uma política de alerta baseada em SQL. A condição de uma política de alertas baseada em SQL analisa periodicamente os dados de entradas de registo e, em seguida, cria incidentes quando a tabela de resultados da consulta cumpre determinados critérios. Este tipo de política de alerta é útil quando precisa de uma política de alerta que monitorize agregações de dados ou padrões complexos em várias entradas de registo. Por exemplo, quer receber uma notificação quando mais de 50 entradas de registo nos últimos 60 minutos tiverem uma gravidade de WARNING.

Para mais informações, consulte o artigo Monitorize os resultados das consultas SQL com uma política de alertas na documentação do Logging.

Componentes da política de alerta

Cada política de alerta tem os seguintes componentes:

  • Uma condição que descreve quando um recurso ou um grupo de recursos está num estado que requer uma resposta da sua parte. A condição inclui a origem de dados, um limite estático ou dinâmico e métodos de agregação de dados, como filtros e groupby. As suas condições podem monitorizar uma única métrica, várias métricas ou uma relação de métricas. Também pode usar a linguagem de consulta Prometheus (PromQL) para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se usar uma integração para ativar uma política de alertas recomendada, a condição da política de alertas é pré-preenchida.

  • Uma lista de canais de notificação que descrevem quem notificar quando é necessária uma ação. Para mais informações, consulte o artigo Crie e faça a gestão de canais de notificação.

  • Documentação que aparece nas notificações e nas páginas de incidentes. Pode configurar a linha de assunto de uma notificação e adicionar informações úteis ao corpo da notificação. Por exemplo, pode configurar a notificação para apresentar links para manuais internos ou para páginas como painéis de controlo personalizados. Google Cloud Para mais informações sobre a documentação, incluindo exemplos, consulte o artigo Anote incidentes com documentação definida pelo utilizador.

Idiomas de consulta

Use a linguagem de consulta Prometheus (PromQL) e filtros nas suas políticas de alerta para ter maior controlo sobre a avaliação das métricas. A monitorização suporta os seguintes tipos de consultas:

  • O PromQL é uma linguagem de consulta funcional usada para avaliar dados de séries cronológicas em tempo real. Pode configurar políticas de alerta para incluir uma consulta PromQL na respetiva condição. As suas consultas PromQL podem usar qualquer expressão válida, como combinações de métricas, rácios e limites de escalabilidade. Ao configurar políticas de alerta baseadas em PromQL no Google Cloud, pode reduzir as dependências da infraestrutura de alerta externa. Para mais informações, consulte os artigos PromQL no Cloud Monitoring e Vista geral dos alertas do PromQL.

  • Os filtros de monitorização permitem-lhe configurar políticas de alerta para usar rácios de métricas baseados em filtros. Não é possível ver nem modificar políticas de alerta baseadas em filtros na Google Cloud consola. Para ver um exemplo de uma política que usa filtros de monitorização, consulte o artigo Rácio de métricas.

Faça a gestão de políticas de alerta e incidentes

Depois de ativar uma política de alertas, o Monitoring monitoriza continuamente as condições dessa política. Não pode configurar a política de alerta para monitorizar condições apenas durante determinados períodos. Se quiser desativar a política de alertas durante um determinado período, crie um adiamento.

Se um incidente estiver aberto e a monitorização determinar que as condições da política baseada em métricas já não são cumpridas, a monitorização fecha automaticamente o incidente e envia uma notificação sobre o encerramento.

Preços

Em geral, as métricas do sistema do Cloud Monitoring são gratuitas, e as métricas de sistemas, agentes ou aplicações externos não o são. As métricas faturáveis são faturadas pelo número de bytes ou pelo número de amostras carregadas.

Para mais informações, consulte as secções do Cloud Monitoring na página de preços do Google Cloud Observability.

Para obter informações sobre como monitorizar o número de intervalos de rastreio ou registos que são carregados, ou como receber uma notificação quando um conteúdo específico é incluído numa entrada de registo, consulte os seguintes documentos:

O que se segue?