Introdução a alertas

O alerta proporciona reconhecimento oportuno de problemas nos seus aplicativos em nuvem para que você possa resolvê-los rapidamente.

No Cloud Monitoring, uma política de alertas descreve as circunstâncias em que você quer ser alertado e como quer ser notificado. Nesta página, você encontra uma visão geral das políticas de alertas.

Para saber como configurar uma política de alertas, consulte o Guia de início rápido do Compute Engine.

Como os alertas funcionam

Cada política de alertas especifica o seguinte:

  • As condições que descrevem quando um recurso ou grupo ou recursos estão em um estado que exige a realização de ações. Uma política de alertas precisa ter pelo menos uma condição. No entanto, é possível configurar uma política para conter várias condições.

    Por exemplo, você pode configurar uma condição da seguinte maneira:

    The HTTP response latency is higher than two seconds for at least five minutes.
    

    Neste exemplo, a condição monitora a latência de resposta HTTP da métrica e especifica quando os valores da métrica exigem que você realize uma ação.

  • Canais de notificação que descrevem quem será notificado quando uma ação for necessária. É possível incluir vários canais de notificação em uma política de alertas. O Cloud Monitoring é compatível com canais de notificação comuns, bem como com o Cloud Mobile App e o Pub/Sub. Para uma lista completa de canais compatíveis e informações sobre como configurar esses canais, consulte Opções de notificação.

    Por exemplo, é possível configurar uma política de alertas para enviar um e-mail my-support-team@example.com e postar uma mensagem do Slack no canal #my-support-team.

  • Documentação que você quer incluir em uma notificação. O campo de documentação é compatível com texto simples, markdown e variáveis.

    Por exemplo, é possível incluir na sua política de alertas a seguinte documentação:

    ## HTTP latency responses
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

Depois que uma política de alertas é configurada, o Monitoring monitora continuamente as condições dessa política. Não é possível configurar as condições a serem monitoradas somente por determinados períodos. Quando as condições dessa política são atendidas, ou seja, quando o estado dos recursos exige que você tome providências, o Monitoring cria um incidente e envia uma notificação sobre ele. criação. Essa notificação inclui informações resumidas sobre o incidente, um link para a página Detalhes da política para que você possa investigar o incidente e qualquer documentação. que você especificou.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política não são mais atendidas, o Monitoring fechará o incidente automaticamente e enviará uma notificação sobre o encerramento.

Exemplo

Você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine que está executando um aplicativo da Web. Embora você saiba que a latência da resposta HTTP pode flutuar à medida que a demanda normal aumenta e diminui, se os usuários começarem a enfrentar alta latência durante um período significativo, você será notificado para que sua compatibilidade a equipe pode agir.

Para ser notificado quando os usuários enfrentarem alta latência, crie a seguinte política de alertas:

  If the HTTP response latency is higher than two seconds for at least five minutes,
  then open an incident and send an email to your support team.

Nesta política de alertas, a condição está monitorando a latência de resposta HTTP. Se essa latência for maior que dois segundos continuamente por cinco minutos, a condição será atendida e um incidente será criado. Um pico transitório na latência não faz com que a condição seja atendida ou um incidente seja criado.

Seu app da Web fica muito famoso, e a latência da resposta aumenta para além de dois segundos. Veja como sua política de alertas responde:

  1. O Monitoring inicia um timer de cinco minutos quando recebe uma medição de latência HTTP superior a dois segundos.

  2. Se cada medida de latência recebida durante os próximos cinco minutos for maior que dois segundos, o temporizador expira. Quando o timer expira, o Monitoring marca a condição como atendida, abre um incidente e envia um e-mail para sua equipe de suporte.

  3. Sua equipe de suporte recebe o e-mail, os sinais no Console do Cloud e confirma o recebimento da notificação.

  4. Seguindo a documentação do e-mail de notificação, sua equipe de suporte é capaz de lidar com a causa da latência. Em alguns minutos, a latência da resposta HTTP cai para abaixo de dois segundos.

  5. Quando o Monitoring recebe uma medição de latência HTTP abaixo de dois segundos, ele fecha o incidente e envia uma notificação para a equipe de suporte sobre o encerramento.

Após o fechamento do incidente, se a latência de resposta HTTP aumentar mais de dois segundos e permanecer maior que esse limite continuamente por cinco minutos, o Monitoring abrirá um novo incidente e enviará um e-mail de notificação.

Como adicionar uma política de alertas

Para adicionar uma política de alertas ao seu projeto do Google Cloud, use o Console do Google Cloud, a API do Cloud Monitoring ou o SDK do Cloud:

  • Se você usar o Console do Cloud, poderá ativar um alerta recomendado ou criar um alerta a partir da página Alertas do Cloud Monitoring.

    Os alertas recomendados estão disponíveis para alguns produtos do Google Cloud. Esses alertas exigem configuração mínima, como a adição de canais de notificação. Por exemplo, se você estiver visualizando a página Tópicos do Pub/Sub Lite, poderá ativar um alerta para notificá-lo se estiver atingindo um limite de cota. Da mesma forma, se você estiver visualizando a página Instâncias de VMs no Monitoring, poderá ativar as políticas de alerta recomendadas que monitoram a utilização da memória e a latência da rede dessas instâncias.

    Para ver informações sobre como criar uma política de alertas ao começar na página Alertas do Cloud Monitoring, consulte Como criar políticas de alertas usando o Console do Cloud.

  • Se você usa a API Cloud Monitoring diretamente ou se usa o SDK do Cloud, pode criar, ver e modificar políticas de alertas. Se você quiser que a condição de uma política de alertas calcule a proporção de duas métricas e, em seguida, compare essa proporção com um limite, crie essa política usando a API Cloud Monitoring ou o SDK do Cloud. para começar. Para ver um exemplo desse tipo de política, consulte Proporção da métrica.

    Para mais informações sobre como usar a API Cloud Monitoring e o SDK do Cloud, consulte Como criar políticas de alertas usando a API Cloud Monitoring ou o SDK do Cloud.

O Cloud Monitoring é compatível com uma linguagem expressiva e baseada em texto que pode ser usada com o Console do Google Cloud e com a API Cloud Monitoring. Para informações sobre como usar essa linguagem com alertas, consulte Como criar políticas de alertas usando a linguagem de consulta do Monitoring (MQL, na sigla em inglês).

Como gerenciar políticas de alertas

Para ver informações sobre como visualizar uma lista de políticas de alertas do seu projeto e como modificá-las, consulte:

Autorização necessária para criar políticas de alertas

Esta seção descreve as funções ou permissões necessárias para criar uma política de alertas. Para informações detalhadas sobre o gerenciamento de identidade e acesso (IAM, na sigla em inglês) do Cloud Monitoring, consulte Controle de acesso.

Cada papel do IAM tem um ID e um nome. Os IDs de papel têm o formato roles/monitoring.editor e são transmitidos como argumentos para a ferramenta de linha de comando gcloud ao configurar o controle de acesso. Para mais informações, consulte Como conceder, alterar e revogar acesso. Os nomes de papéis, como "Editor do Monitoring", são exibidos pelo Console do Cloud.

Papéis obrigatórios do Console do Cloud

Para criar uma política de alertas, o nome do papel do IAM para o projeto do Google Cloud precisa ser um dos seguintes:

  • Editor do Monitoring
  • Administrador do Monitoring
  • Proprietário do projeto

Para ver uma lista de papéis e as permissões associadas, consulte Papéis.

Permissões de API necessárias

Para usar a API do Cloud Monitoring para criar uma política de alertas, o ID do papel do IAM para o projeto do Google Cloud precisa ser um dos seguintes:

  • roles/monitoring.alertPolicyEditor: este código de papel concede as permissões mínimas necessárias para criar uma política de alertas. Para mais detalhes sobre esse papel, consulte Papéis de alerta predefinidos.
  • role/monitoring.editor
  • role/monitoring.admin
  • role/owner

Para identificar a permissão necessária para um método específico da API Cloud Monitoring, consulte Permissões da API Cloud Monitoring. Para ver uma lista de papéis e as permissões associadas, consulte Papéis.

Como determinar o papel

Para determinar o papel de um projeto usando o Console do Cloud, faça o seguinte:

  1. Abra o Console do Cloud e selecione o projeto do Google Cloud:

    Acessar o Console do Cloud

  2. Para visualizar o papel, clique em IAM e administrador. O papel está na mesma linha que o nome de usuário.

Para determinar as permissões no nível da organização, entre em contato com o administrador da organização.

Custos associados às políticas de alertas

Não há custos associados ao uso de políticas de alertas ou verificações de tempo de atividade, mas há os seguintes limites:

Categoria Valor
Verificações de tempo de atividade por escopo de métricas 1 100
Políticas de alerta por escopo de métricas 2 500
Condições por política de alertas 6
Canais de notificação por política de alertas 16
Canais de notificação por escopo de métricas 4000
Incidentes abertos simultaneamente por política de alertas 5.000
Duração máxima para uma condição de ausência de métrica 1 dia
Duração máxima para uma condição de limite de métrica 23 horas e 30 minutos
1Esse limite se aplica ao número de configurações de verificação de tempo de atividade. Cada configuração de verificação de tempo de atividade inclui o intervalo de tempo entre o teste do status do recurso especificado. Consulte Como gerenciar verificações de tempo de atividade para obter mais informações.

2Apigee e Apigee híbrido são profundamente integrados a Cloud Monitoring O limite de alertas para todos os níveis de assinatura da Apigee (padrão, Enterprise e Enterprise Plus) é o mesmo do Cloud Monitoring: 500 por escopo de métricas .

Para informações completas sobre preços, consulte Preços do conjunto de operações do Google Cloud.

A seguir