Introdução a alertas

O alerta proporciona reconhecimento oportuno de problemas nos seus aplicativos em nuvem para que você possa resolvê-los rapidamente.

Para criar uma política de alertas, você precisa descrever as circunstâncias em que quer receber alerta e como quer a notificação. Nesta página, fornecemos uma visão geral das políticas de alertas e os conceitos envolvidos.

Para uma introdução mais prática, siga as etapas em um destes guias de início rápido:

Para uma política de alertas que monitora o uso e avisa quando você se aproxima do limite de faturamento, consulte Como controlar seus custos.

Como os alertas funcionam?

É possível criar e gerenciar políticas de alertas com o Console do Google Cloud, a API do Cloud Monitoring e o SDK do Cloud.

Cada política tem as seguintes especificações:

  • As condições identificam um estado não íntegro em um recurso ou grupo de recursos. As condições de uma política de alertas são monitoradas continuamente. Não é possível configurar as condições a serem monitoradas somente por determinados períodos.

  • As notificações opcionais são enviadas por e-mail, SMS ou outros canais para que sua equipe de suporte saiba que um recurso não está íntegro.

  • A documentação opcional pode ser incluída em alguns tipos de notificações para ajudar sua equipe de suporte a resolver o problema.

Quando os eventos acionam condições em uma das suas políticas de alerta, o Cloud Monitoring cria e exibe um incidente no Console do Google Cloud. Se você configurar notificações, o Cloud Monitoring também enviará notificações para pessoas ou serviços de notificação de terceiros. Os responsáveis pelas respostas podem confirmar o recebimento da notificação, mas o incidente permanece aberto até que os recursos não estejam mais em estado não íntegro.

Para mais informações sobre esses conceitos, consulte Detalhes sobre as políticas de alertas.

Exemplo

Você implanta um aplicativo da Web em uma instância de VM do Compute Engine que está executando uma pilha LAMP. Embora você saiba que a latência da resposta HTTP pode flutuar à medida que a demanda normal aumenta e diminui, se os usuários começarem a enfrentar alta latência durante um período significativo, será necessário tomar providências.

Para ser notificado quando os usuários enfrentarem alta latência, crie a seguinte política de alertas:

Se a latência da resposta HTTP for maior que dois segundos,
e se essa condição durar mais de cinco minutos,
abra um incidente e envie um e-mail para sua equipe de suporte.

Seu app da Web fica mais famoso do que você esperava e a latência da resposta aumenta para além de dois segundos. Veja como sua política de alertas responde:

  1. O Cloud Monitoring abre um incidente e envia um e-mail após cinco minutos consecutivos de latência HTTP superior a dois segundos.

  2. A equipe de suporte recebe o e-mail, os sinais no Console do Google Cloud e confirma o recebimento da notificação.

  3. Após a documentação no e-mail de notificação, a equipe pode lidar com a causa da latência. Dentro de alguns minutos, as respostas HTTP retornam para abaixo de dois segundos.

  4. Assim que o Cloud Monitoring medir a latência HTTP abaixo de dois segundos, a condição da política não será mais verdadeira. Até mesmo uma única medição de latência inferior divide o requisito de "cinco minutos consecutivos".

    O Cloud Monitoring encerra o incidente e redefine o timer de cinco minutos. Se a latência aumentar para acima de dois segundos durante os próximos cinco minutos consecutivos, a política abrirá um novo incidente.

Preços e limites

Não há custos associados ao uso de políticas de alertas ou verificações de tempo de atividade, mas há os seguintes limites:

Category Valor
Verificações de tempo de atividade por espaço de trabalho 100*
Políticas de alertas por espaço de trabalho 500
Condições por política de alertas 6
Canais de notificação por política de alertas 16
Canais de notificação por espaço de trabalho 4000
Incidentes abertos simultaneamente por política de alertas 5000
*Esse limite se aplica ao número de configurações de verificação de tempo de atividade. Cada configuração de verificação de tempo de atividade inclui o intervalo de tempo entre o teste do status do recurso especificado. Consulte Como gerenciar verificações de tempo de atividade para obter mais informações.

Para obter informações completas sobre preços, consulte Preços do conjunto de operações do Google Cloud.

A seguir