Criar políticas de alertas com base em métricas

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Neste documento, descrevemos como usar o console do Google Cloud para criar uma política de alertas que monitora uma métrica. Por exemplo, uma política de alertas que monitora o uso da CPU de uma máquina virtual (VM) pode notificar uma equipe de plantão quando a política é acionada. Como alternativa, uma política que monitora uma verificação de tempo de atividade pode notificar as equipes de plantão e desenvolvimento.

Este conteúdo não se aplica a políticas de alertas baseadas em registros. Para informações sobre políticas de alertas com base em registros, que informam quando uma mensagem específica aparece nos registros, consulte Como monitorar os registros.

Este documento não descreve:

Antes de começar

  1. Para receber as permissões necessárias para criar e modificar políticas de alertas usando o console do Google Cloud, peça ao administrador para conceder a você o papel de IAM de Editor do Monitoring (roles/monitoring.editor) no projeto. Para mais informações sobre como conceder papéis, consulte Gerenciar o acesso.

    Para mais informações sobre os papéis do Cloud Monitoring, consulte Controle de acesso.

  2. Conheça os conceitos gerais das políticas de alertas. Para ver informações sobre esses tópicos, consulte Introdução a alertas.

  3. Configure os canais de notificação que você quer usar para receber alertas. Para informações sobre essas etapas, consulte Gerenciar canais de notificação.

    Para fins de redundância, recomendamos que você crie vários tipos de canais de notificação. Para mais informações, consulte Gerenciar canais de notificação.

Criar políticas de alerta

Nesta seção, descrevemos como criar uma política de alertas. Por padrão, ao iniciar o fluxo de alerta com o Console do Google Cloud, uma interface orientada por menu é exibida. Use esses menus para selecionar o tipo de métrica que você quer monitorar e para configurar a política. O menu de seleção de métricas lista todos os tipos de métrica gerados pelos serviços do Google Cloud e os tipos de métricas personalizadas definidos, desde que haja dados para o tipo de métrica.

Há três tipos de condição. Essas condições são acionadas com base no valor de uma métrica que ultrapassa um limite, na ausência de dados da métrica ou no valor previsto de uma métrica que ultrapassa um limite. Para informações sobre como configurar essas condições, consulte as seguintes seções deste documento:

Para criar um alerta para algo diferente de um tipo de métrica gerado por um serviço do Google Cloud ou tipos de métricas personalizadas definidos por você, use um dos fluxos especializados de alerta. Por exemplo, a página Serviços no Console do Google Cloud contém um fluxo de alertas de criação guiado específico ao monitoramento de objetivos de nível de serviço (SLO). Para informações sobre os tipos especializados de políticas de alertas que podem ser do seu interesse, consulte:

Alerta sobre o valor da métrica

Nesta seção, descrevemos como criar uma política de alertas que monitora um tipo de métrica integrado ou um tipo de métrica personalizada que você cria e compara o valor dessa métrica com um limite estático. Para criar uma política que compare o valor de uma série temporal com um limite dinâmico, use MQL. Para mais informações, consulte Criar níveis de gravidade dinâmica usando MQL.

Este conteúdo não se aplica a políticas de alertas baseadas em registros. Para informações sobre políticas de alertas com base em registros, que informam quando uma mensagem específica aparece nos registros, consulte Como monitorar os registros.

Para criar uma política de alertas que compare o valor dessa métrica com um limite estático, faça o seguinte:

  1. No console do Google Cloud, selecione Monitoramento ou clique no botão a seguir:
    Acessar o Monitoring

  2. No painel de navegação, selecione Alertas e clique em Criar política.

  3. Selecione a série temporal a ser monitorada:

    1. Clique em Selecionar uma métrica e insira o nome do tipo de métrica ou de recurso de interesse na barra de filtro. Por exemplo, se você inserir "Instância de VM" na barra de filtros, somente os tipos de métricas para instâncias de VM serão listados. Se você digitar "CPU", os menus só exibirão tipos de métrica que contenham "CPU" no nome.

    2. Navegue pelos menus para selecionar uma métrica e clique em Aplicar.

      Se o tipo de métrica que você quer monitorar não estiver listado, desative Mostrar apenas recursos e métricas ativos no menu Selecionar uma métrica. Para mais informações, consulte Resolver problemas: métrica não listada no menu.

    3. Opcional: para monitorar um subconjunto da série temporal que corresponde aos tipos de métrica e recurso selecionados na etapa anterior, clique em Adicionar filtro. Na caixa de diálogo de filtro, selecione o rótulo para filtrar, um comparador e o valor do filtro. Por exemplo, o filtro zone =~ ^us.*.a$ usa uma expressão regular para corresponder a todos os dados de série temporal com um nome de zona que começa com us e termina com a. Veja mais informações em Filtrar os dados selecionados.

    4. Opcional: para alterar a forma como os pontos de uma série temporal são alinhados, defina a janela de rolagem e a função de janela contínua na seção Transformar dados.

      Esses campos especificam como os pontos gravados em uma janela são combinados. Por exemplo, suponha que a janela tenha 15 minutos e a função da janela seja max. O ponto alinhado é o valor máximo de todas as amostras registradas nos 15 minutos mais recentes. Para mais informações, consulte Alinhar série temporal.

    5. Opcional: combine séries temporais quando quiser reduzir o número de séries temporais monitoradas por uma política ou quando quiser monitorar apenas uma coleção de séries temporais. Por exemplo, talvez você queira monitorar a utilização da CPU das suas instâncias de VM pela média de zona. Por padrão, as séries temporais não são combinadas.

      Para combinar todas as séries temporais, faça o seguinte:

      1. Clique em Expandir no cabeçalho Em série temporal.
      2. Defina o campo Agregação de série temporal como um valor diferente de none. Por exemplo, quando você seleciona mean, cada ponto na série temporal exibida é a média de pontos da série temporal individual.
      3. O campo Agrupar por série temporal precisa estar vazio.

      Para combinar ou agrupar séries temporais por valores de rótulo, faça o seguinte:

      1. Clique em Expandir no cabeçalho Em série temporal.
      2. Defina o campo Agregação de série temporal como um valor diferente de none.
      3. No campo Agrupar por série temporal, selecione um ou mais identificadores que serão usados para agrupar.

      Por exemplo, se você agrupar por zone e definir o campo de agregação como mean, o gráfico exibirá uma série temporal para cada zona. A série temporal mostrada para uma zona específica é a média de todas as séries temporais com essa zona.

      Os campos da Transformação de dados secundários ficam desativados por padrão. Quando ativadas, essas operações são aplicadas após a transformação de dados principal.

      Para mais informações, consulte Combinar séries temporais.

    6. Clique em Next.

  4. Configure o gatilho de condição:

    1. Deixe o campo Tipo de condição com o valor padrão de Limite.

    2. Selecione um valor para o menu Acionador de alerta. Nesse menu, é possível especificar o subconjunto de séries temporais que precisam violar o limite antes do acionamento da condição.

    3. Insira quando o valor de uma métrica viola o limite usando os campos Posição do limite e Valor do limite. Por exemplo, se você definir esses valores como Acima do limite e 0.3, qualquer medida superior a 0.3 violará o limite.

    4. Opcional: para selecionar o tempo em que as medições precisam violar o limite antes de os alertas gerarem um incidente, expanda Opções avançadas e use o menu Janela de teste novamente.

      O valor padrão é Sem novo teste. Com essa configuração, uma única medida pode resultar em uma notificação. Para ver mais informações e um exemplo, consulte O período de alinhamento e a duração.

    5. Opcional: para especificar como o Monitoring avalia a condição quando os dados deixam de chegar, expanda Opções avançadas e use o menu Avaliar dados ausentes.

      O menu Avaliação de dados ausentes é desativado quando o valor da Janela de novo teste é Sem novo teste.

      Console do Google Cloud
      Campo "Avaliação de dados ausentes"
      Resumo Detalhes
      Dados ausentes vazios Os incidentes abertos permanecem abertos.
      Os novos incidentes não são abertos.

      Quando as condições são atendidas, ela continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente é aberto e nenhum dado é recebido, o timer de fechamento automático é iniciado após um atraso de pelo menos 15 minutos. Se o timer expirar, o incidente será fechado.

      No caso de condições não atendidas, ela continua não sendo atendida quando os dados param de chegar.

      Os pontos de dados ausentes são tratados como valores que violam a condição da política Os incidentes abertos permanecem abertos.
      É possível abrir novos incidentes.

      Quando as condições são atendidas, ela continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente é aberto e nenhum dado chega à duração do fechamento automático mais 24 horas, o incidente é encerrado.

      Para condições que não são atendidas, essa configuração faz com que a condição de limite de métrica se comporte como uma metric-absence condition. Se os dados não chegarem no horário especificado pela janela de novo teste, a condição será avaliada como atendida. Para uma política de alertas com uma condição, a condição atendida resulta na abertura de um incidente.

      Os pontos de dados ausentes são tratados como valores que não violam a condição da política Os incidentes abertos estão fechados.
      Os novos incidentes não são abertos.

      No caso de condições atendidas, ela deixa de ser atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele será fechado.

      No caso de condições não atendidas, ela continua não sendo atendida quando os dados param de chegar.

    6. Clique em Next.

  5. Opcional: crie uma política de alertas com várias condições.

    A maioria das políticas monitora um único tipo de métrica. Por exemplo, uma política pode monitorar o número de bytes gravados em uma instância de VM. Quando quiser monitorar vários tipos de métricas, crie uma política com várias condições. Cada condição monitora um tipo de métrica. Depois de criar as condições, você especifica como as condições são combinadas. Para mais informações, consulte Políticas com várias condições.

    Para criar uma política de alertas com várias condições, faça o seguinte:

    1. Para cada condição adicional, clique em Adicionar condição de alerta e configure-a.
    2. Clique em Próxima e configure como as condições são combinadas.
    3. Clique em Próxima para acessar as notificações e a documentação configuradas.
  6. Configure as notificações e a documentação:

    1. Expanda o menu Canais de notificação e selecione seus canais de notificação. Para fins de redundância, recomendamos que você adicione a uma política de alertas vários tipos de canais de notificação. Para mais informações, consulte Gerenciar canais de notificação.

    2. Opcional: para receber uma notificação quando um incidente for encerrado, selecione Notificar sobre o fechamento de incidentes. Por padrão, quando você cria uma política de alertas com o console do Google Cloud, uma notificação é enviada apenas quando um incidente é criado.

    3. Opcional: para alterar quanto tempo o Monitoring aguarda antes de fechar um incidente após a chegada dos dados, selecione uma opção no menu Duração de fechamento automático de incidentes. Por padrão, quando os dados param de chegar, o Monitoring aguarda sete dias antes de fechar um incidente aberto.

    4. Opcional: para adicionar rótulos personalizados à política de alertas, na seção Rótulos de usuário da política, faça o seguinte:

      1. Clique em Adicionar rótulo e, no campo Chave, insira um nome para o rótulo. Os nomes de rótulos precisam começar com uma letra minúscula e podem conter letras minúsculas, numerais, sublinhados e traços. Por exemplo, insira severity.
      2. Clique em Valor e insira um valor para o rótulo. Os valores do rótulo podem conter letras minúsculas, numerais, sublinhados e traços. Por exemplo, insira critical.

      Para informações sobre como usar rótulos de política para gerenciar alertas, consulte Adicionar níveis de gravidade a uma política de alertas.

    5. Opcional: para incluir documentação personalizada em uma notificação, insira esse conteúdo na seção Documentação. Para formatar a documentação, use o Markdown. Para extrair informações da própria política e personalizar o conteúdo da documentação, use variáveis. Por exemplo, a documentação pode incluir um título como Addressing High CPU Usage e detalhes que identificam o projeto:

      ## Addressing High CPU Usage
      
      This note contains information about high CPU Usage.
      
      You can include variables in the documentation. For example:
      
      This alert originated from the project ${project}, using
      the variable $${project}.
      

      Quando as notificações são criadas, o Monitoring substitui as variáveis pelos valores. Os valores substituem as variáveis somente nas notificações. O painel de visualização e outros locais no console do Google Cloud mostram apenas a formatação Markdown:

      Exemplo de gravação de uma observação de documentação usando o markdown.

      Para mais informações, consulte Como usar o Markdown e as variáveis em modelos de documentação e Como usar controles de canal.

    6. Clique em Nome e digite um nome para a política de alertas.

  7. Clique em Criar política.

Alerta sobre a ausência de métrica

Para receber uma notificação quando você parar de receber dados de métricas por uma janela de duração específica, crie uma política de alertas com uma condição de ausência de métrica. As condições de ausência de métrica exigem pelo menos uma medição bem-sucedida, que recupera dados, dentro da janela de duração máxima após a instalação ou modificação da política. A janela de duração máxima configurável será de 24 horas se você usar o console do Google Cloud e de 24,5 horas se usar a API Cloud Monitoring.

Para criar uma política de alertas com uma condição de ausência de métrica, faça o seguinte:

  1. No console do Google Cloud, selecione Monitoramento ou clique no botão a seguir:
    Acessar o Monitoring
  2. No painel de navegação, selecione Alertas e clique em Criar política.
  3. Selecione a métrica a ser monitorada, adicione filtros e especifique como os dados são transformados. Estas etapas são as mesmas para todos os tipos de condições. Para ver detalhes sobre essas etapas, consulte Alerta sobre o valor da métrica: selecionar série temporal.
  4. Configure o gatilho de condição:

    1. Selecione Ausência de métrica como o tipo de condição.
    2. Selecione um valor para o menu Acionador de alerta. Nesse menu, é possível especificar o subconjunto de séries temporais que não podem ter dados antes que a condição seja acionada.
    3. Especifique o período em que os dados da métrica precisam estar ausentes antes que os alertas notifiquem você usando o campo Ausência do tempo de ausência.

    O Monitoring sempre avalia as condições de ausência de métrica com a janela contínua definida como 24 horas. O console exibe uma mensagem indicando que o valor inserido está sendo substituído.

  5. Configure os canais de notificação, a documentação e o nome da política de alertas. Para mais informações, consulte Alerta sobre o valor da métrica: notificações e documentação.

  6. Revise a política de alertas e clique em Criar política.

Alerta sobre o valor previsto de uma métrica

Para receber uma notificação quando a política de alertas prevê que o limite será violado em uma janela de previsão, crie uma condição de previsão. As condições da previsão são projetadas para monitorar métricas de restrição. As métricas de restrição incluem aquelas que registram o uso de cota, memória e armazenamento.

Para criar uma política de alertas que crie um alerta com base em uma previsão, faça o seguinte:

  1. No console do Google Cloud, selecione Monitoramento ou clique no botão a seguir:
    Acessar o Monitoring
  2. No painel de navegação, selecione Alertas e clique em Criar política.
  3. Selecione a métrica a ser monitorada, adicione filtros e especifique como os dados são transformados. Estas etapas são as mesmas para todos os tipos de condições. Para ver detalhes sobre essas etapas, consulte Alerta sobre o valor da métrica: selecionar série temporal.

    Selecione uma métrica de restrição que tenha um tipo de valor duplo ou int64 e não selecione uma para uma instância de VM da Amazon. Quando mais de 64 séries temporais são monitoradas, o Monitoring faz previsões para as 64 séries temporais com valores mais próximos do limite ou que já violam o limite. Para outras séries temporais, os valores são comparados ao limite.

  4. Configure o gatilho de condição:

    1. Selecione Previsão para o tipo de condição.

    2. Selecione um valor para o menu Acionador de alerta. Nesse menu, é possível especificar o subconjunto de séries temporais que precisam violar o limite antes do acionamento da condição.

    3. Selecione um valor para a janela Previsão. O valor selecionado é a quantidade de tempo futura da previsão. É preciso definir esse valor como pelo menos 1 hora (3.600 segundos) e no máximo 7 dias (604.800 segundos).

    4. Insira quando o valor previsto da métrica selecionada viola o limite usando os campos Posição do limite e Valor do limite. Por exemplo, se você definir esses valores como Acima do limite e 10, qualquer valor previsto maior que 10 vai violar o limite.

    5. Opcional: expanda Opções avançadas e defina o valor da Janela de teste. O valor padrão desse campo é Sem novo teste. Recomendamos que você defina esse campo para pelo menos 10 minutos.

      Por exemplo, suponha que você configure a condição de previsão de modo que qualquer série temporal possa acionar a condição. Suponha também que a janela "Testar" esteja definida como 15 minutos, a janela "Previsão" definida como uma hora e que ocorra uma violação quando o valor da série temporal é maior que o limite, definido como 10. A condição será acionada se uma das seguintes situações ocorrer:

      • Todos os valores de uma série temporal ficam maiores que 10 e permanecem nela por pelo menos 15 minutos.
      • Em um intervalo de 15 minutos, cada previsão de uma série temporal prevê que o valor aumentará mais do que o limite de 10 em algum momento na próxima hora.
    6. Opcional: para especificar como o Monitoring avalia a condição quando os dados param de chegar, expanda Opções avançadas e use o menu Avaliar dados ausentes.

      O menu Avaliação de dados ausentes é desativado quando o valor da Janela de novo teste é Sem novo teste.

      Quando faltam dados por mais de 10 minutos, uma condição de previsão para de fazer previsões e usa o valor do campo Avaliação de dados ausentes para determinar como gerenciar incidentes. Quando as observações são reiniciadas, a previsão é reiniciada.

      Console do Google Cloud
      Campo "Avaliação de dados ausentes"
      Resumo Detalhes
      Dados ausentes vazios Os incidentes abertos permanecem abertos.
      Os novos incidentes não são abertos.

      Quando as condições são atendidas, ela continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente é aberto e nenhum dado é recebido, o timer de fechamento automático é iniciado após um atraso de pelo menos 15 minutos. Se o timer expirar, o incidente será fechado.

      No caso de condições não atendidas, ela continua não sendo atendida quando os dados param de chegar.

      Os pontos de dados ausentes são tratados como valores que violam a condição da política Os incidentes abertos permanecem abertos.
      É possível abrir novos incidentes.

      Quando as condições são atendidas, ela continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente é aberto e nenhum dado chega à duração do fechamento automático mais 24 horas, o incidente é encerrado.

      Para condições que não são atendidas, essa configuração faz com que a condição de limite de métrica se comporte como uma metric-absence condition. Se os dados não chegarem no horário especificado pela janela de novo teste, a condição será avaliada como atendida. Para uma política de alertas com uma condição, a condição atendida resulta na abertura de um incidente.

      Os pontos de dados ausentes são tratados como valores que não violam a condição da política Os incidentes abertos estão fechados.
      Os novos incidentes não são abertos.

      No caso de condições atendidas, ela deixa de ser atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele será fechado.

      No caso de condições não atendidas, ela continua não sendo atendida quando os dados param de chegar.

    7. Clique em Next.

  5. Configure os canais de notificação, a documentação e o nome da política de alertas. Para mais informações, consulte Alerta sobre o valor da métrica: notificações e documentação.

  6. Revise a política de alertas e clique em Criar política.

Alerta sobre a taxa de mudança de uma métrica

Para receber uma notificação quando a taxa de mudança de uma métrica exceder um limite, crie uma política de alertas de taxa de mudança. Por exemplo, para ser notificado quando o uso da CPU aumentar muito rapidamente, crie esse tipo de política.

Para criar esse tipo de política, siga as etapas descritas em Alerta sobre o valor da métrica. No entanto, defina o campo Função de janela contínua como porcentagem de alterações.

Quando você seleciona a função percent change, o Monitoring faz o seguinte:

  1. Se a série temporal tiver um tipo de métrica DELTA ou CUMULATIVE, a série temporal será convertida em um tipo de métrica GAUGE. Para informações sobre a conversão, consulte Tipos, tipos e conversões.
  2. A computação calcula a porcentagem de mudança comparando o valor médio na janela mais recente de 10 minutos com o valor médio da janela de 10 minutos antes da janela de novo teste.

    A janela de lookback de 10 minutos é um valor fixo que não pode ser alterado. No entanto, você especifica a janela de novo teste ao criar uma condição.

Alerta sobre a contagem de processos em execução em uma VM

Para monitorar o número de processos em execução nas VMs que atendem às condições especificadas, crie uma política de alertas de process-health. Por exemplo, é possível contar o número de processos iniciados pelo usuário raiz. Também é possível contar o número de processos em que o comando da invocação continha uma string específica. Uma política de alertas pode notificar você quando o número de processos é maior ou menor que um limite. Para informações sobre quais processos podem ser monitorados, consulte Processos que são monitorados.

As métricas de integridade do processo estão disponíveis quando o agente de operações ou o agente do Monitoring são executados nos recursos monitorados. Para mais informações sobre os agentes, consulte Agentes do pacote de operações do Google Cloud.

Para monitorar a contagem de processos em execução em uma VM, faça o seguinte:

  1. No console do Google Cloud, selecione Monitoramento ou clique no botão a seguir:
    Acessar o Monitoring

  2. No painel de navegação, selecione Alertas e clique em Criar política.

  3. Selecione ? no cabeçalho da seção Selecionar métrica e, em seguida, selecione Modo de filtro direto na dica.

  4. Insira um filtro do Monitoring.

    Por exemplo, para contar o número de processos em execução em instâncias de VM do Compute Engine com um nome que inclua nginx, digite o seguinte:

    select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
    resource.type="gce_instance"
    

    Para saber mais, acesse os recursos a seguir:

  5. Preencha a caixa de diálogo da política de alertas. Essas etapas estão descritas somente nesta seção. Para ver todos os detalhes, consulte Alerta sobre o valor da métrica:

    1. Opcional: revise e atualize as configurações de transformação dos dados.
    2. Clique em Próxima e configure o acionador de condição.
    3. Clique em Próxima e conclua as etapas de notificação e documentação.
    4. Clique em Nome e digite um nome para a política de alertas.
    5. Clique em Criar política.

Processos monitorados

Nem todos os processos em execução no sistema podem ser monitorados por uma condição de integridade do processo. Essa condição seleciona processos a serem monitorados usando uma expressão regular aplicada à linha de comando que invocou o processo. Quando o campo de linha de comando não está disponível, o processo não pode ser monitorado.

Uma maneira de determinar se um processo pode ser monitorado por uma condição de integridade é observar os processos ativos. Por exemplo, em um sistema Linux, use o comando ps:

    ps aux | grep nfs
    USER      PID  %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
    root      1598  0.0  0.0      0     0 ?        S<   Oct25   0:00 [nfsd4]
    root      1639  0.0  0.0      0     0 ?        S    Oct25   2:33 [nfsd]
    root      1640  0.0  0.0      0     0 ?        S    Oct25   2:36 [nfsd]

Quando uma entrada COMMAND está entre colchetes, como [nfsd], as informações da linha de comando do processo não estão disponíveis. Nessa situação, não é possível usar o Cloud Monitoring para monitorar o processo.

Alertar quando um SLO for violado

Para receber uma notificação quando um sistema corre o risco de violar um objetivo de nível de serviço (SLO), crie uma política de alertas. Por exemplo, um SLO de algum sistema pode ser 99% de disponibilidade em uma semana. Um SLO diferente pode especificar que a latência possa exceder 300 ms em apenas 5% das solicitações em um período contínuo de 30 dias.

Para informações sobre como criar um alerta para um SLO, consulte os seguintes documentos:

Para criar uma política de alertas de SLO quando você usa a API Cloud Monitoring, os dados fornecidos à API incluem o seletor de séries temporais. Para informações sobre esses seletores, consulte Como recuperar dados de SLO.

É possível criar uma política de alertas de SLO usando a interface de alertas no Console do Google Cloud. Para fazer isso, siga as etapas descritas em Criar uma política de alertas de integridade do processo. No entanto, quando você chegar à etapa para inserir um filtro do Monitoring, insira um seletor de série temporal em vez de uma expressão de integridade do processo.

Alertar quando a verificação de tempo de atividade falhar

Recomendamos que você crie uma política de alertas para notificá-lo quando uma verificação de tempo de atividade falhar. A infraestrutura de verificação de tempo de atividade inclui um fluxo guiado de criação de alertas. Para ver detalhes sobre essas etapas, consulte Alertas de verificações de tempo de atividade.

Restringir a condição a um grupo de recursos

Se você quiser monitorar uma coleção de recursos, em que a associação ao grupo é definida por alguns critérios, crie um grupo de recursos e monitore o grupo. Por exemplo, é possível definir um grupo de recursos para as instâncias de VM do Compute Engine usadas na produção. Depois de criar esse grupo, será possível criar uma política de alertas que monitore apenas esse grupo de instâncias. Quando você adiciona uma VM que corresponde aos critérios do grupo, a política de alertas monitora automaticamente essa VM.

É possível criar uma política de alertas de grupo de recursos usando o console do Google Cloud. Para fazer isso, siga as etapas descritas em Criar uma política de alertas de integridade do processo. No entanto, depois de selecionar a métrica, adicione um filtro que restrinja a série temporal aquelas que correspondem aos critérios do grupo.

Para criar uma política de alertas que monitore um grupo de recursos, faça o seguinte:

  1. No console do Google Cloud, selecione Monitoramento ou clique no botão a seguir:
    Acessar o Monitoring

  2. No painel de navegação, selecione Alertas e clique em Criar política.

  3. Selecione a série temporal a ser monitorada:

    1. Clique em Selecionar uma métrica e insira o nome do tipo de métrica ou de recurso de interesse na barra de filtro. Por exemplo, se você inserir "Instância de VM" na barra de filtros, somente os tipos de métricas para instâncias de VM serão listados. Se você digitar "CPU", os menus só exibirão tipos de métrica que contenham "CPU" no nome.

    2. Navegue pelos menus para selecionar uma métrica e clique em Aplicar.

      Se o tipo de métrica que você quer monitorar não estiver listado, desative Mostrar apenas recursos e métricas ativos no menu Selecionar uma métrica. Para mais informações, consulte Resolver problemas: métrica não listada no menu.

    3. Clique em Adicionar filtro e selecione Grupo.

    4. Abra o Valor e selecione o nome do grupo.

    5. Clique em Concluído.

  4. Conclua as etapas para configurar a política de alertas conforme descrito em Alerta sobre o valor da métrica: configurar gatilho.

Solução de problemas: métrica não listada no menu

Por padrão, os menus Selecionar uma métrica listam todos os tipos de métricas que contêm dados. Por exemplo, se você não usar o Pub/Sub, esses menus não listarão nenhuma métrica do Pub/Sub.

É possível configurar um alerta mesmo quando os dados que você quer monitorar não existem:

  • Para criar um alerta que monitore uma métrica do Google Cloud, siga as etapas descritas em Alerta sobre o valor da métrica. No entanto, na etapa em que você seleciona uma métrica, desative Mostrar apenas métricas e recursos ativos no menu Selecionar uma métrica. Quando desativado, o menu lista todas as métricas dos serviços do Google Cloud e todas as métricas com dados.

  • Para configurar um alerta para um tipo de métrica personalizada antes que esse tipo de métrica gere dados, siga as etapas descritas em Criar uma política de alertas de integridade do processo. Na etapa de inserção de um filtro do Monitoring, insira um filtro que especifique o tipo de métrica e o recurso. Veja a seguir um exemplo de filtro do Monitoring que especifica um tipo de métrica:

    metric.type="compute.googleapis.com/instance/disk/write_bytes_count"
    resource.type="gce_instance"