Como gerenciar políticas de alertas com base em métricas

Neste documento, mostramos como usar o Console do Google Cloud para criar e gerenciar uma política de alertas com base em métricas. Este conteúdo não se aplica a políticas de alertas baseadas em registros. Para informações sobre políticas de alertas com base em registros, que informam quando uma mensagem específica aparece nos registros, consulte Como monitorar os registros.

Com uma política de alertas, é possível descrever um conjunto de condições que você queira monitorar. Essas condições podem estar relacionadas à integridade de um aplicativo, ao valor de uma métrica do sistema ou ao consumo de recursos. Por exemplo, talvez você queira uma política que monitore uma verificação de tempo de atividade ou que monitore o uso da API Cloud Monitoring. Uma política de alertas também permite especificar como você quer ser notificado quando as condições da política forem atendidas e qual documentação será incluída nessa notificação.

Também é possível usar a API Cloud Monitoring para criar e gerenciar políticas de alertas. Para mais informações sobre essa abordagem, consulte Como gerenciar políticas de alertas por API. Para ver as políticas representadas em JSON, consulte Políticas de amostra.

Antes de começar

Antes de criar políticas de alertas, conheça a terminologia e os conceitos gerais delas. Para informações sobre os componentes de uma política, o conceito de um incidente, os preços e limitações, consulte Introdução a alertas.

Crie uma política de alertas

O Cloud Monitoring está atualizando a interface usada para criar uma política de alertas. Neste documento, você encontra informações sobre a interface legada e a interface na prévia. Para retornar à interface legada ao usar a interface de visualização, clique em Retornar à IU legada.

Interface legada

Para criar uma política de alertas, siga estas etapas:

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring

  2. Selecione Alertas.

  3. Clique em Criar política para ver a página Criar política de alertas:

    A caixa de diálogo Criar uma política de alertas é exibida.

    1. Clique em Adicionar condição e preencha a caixa de diálogo. Para ver informações sobre os campos em uma condição, consulte Como especificar condições.

      Uma condição descreve um recurso monitorado, uma métrica para esse recurso e quando a condição é atendida. Uma política de alertas precisa ter pelo menos uma condição. No entanto, as políticas de alertas podem conter até seis condições. Quando uma política de alertas tem exatamente uma condição e quando ela é atendida, um incidente é criado. Quando uma política de alertas tem várias condições, você especifica como essas condições são combinadas. Para mais informações, consulte Políticas com várias condições.

    2. Clique em Avançar para ir para a seção de notificações.

    3. Para ser informado quando um incidente for criado, adicione um canal de notificação à sua política de alertas. É possível adicionar vários canais de notificação. Para ver detalhes sobre as opções de canais de notificação, consulte Opções de notificação.

      Para adicionar um canal de notificação, clique em Canais de notificação. Na caixa de diálogo, selecione um ou mais canais de notificação no menu e clique em OK.

      Caixa de diálogo de notificação que exibe os botões de atualização e gerenciamento de canais.

      Para adicionar um canal de notificação à lista de canais, clique em Gerenciar canais de notificação. Você será direcionado para a página Canais de notificação em uma nova guia do navegador. Nessa página, você pode atualizar os canais de notificação configurados. Quando suas atualizações estiverem concluídas, retorne à guia original, clique em Atualizar e selecione os canais de notificação a serem adicionados à política de alertas. Para mais informações, consulte Como criar um canal sob demanda.

    4. (Opcional) Para ser notificado quando um incidente for aberto e fechado, selecione Notificar sobre o fechamento do incidente. Por padrão, as notificações são enviadas apenas quando um incidente é aberto.

      Exibição do botão de notificação no fechamento de incidentes

    5. (Opcional) Se o campo Duração do fechamento automático de incidentes for exibido, defina o valor dele como a duração que o Monitoring precisa aguardar antes de fechar incidentes quando as observações pararem de chegar. O valor padrão desse campo é sete dias. A duração mínima de fechamento automático é de 30 minutos.

      Por exemplo, suponha que você tenha um alerta com uma condição de limite de métrica que monitore uma máquina virtual (VM, na sigla em inglês). Se você desativar a VM enquanto um incidente estiver aberto, o Monitoring aguardará, por padrão, sete dias antes de fechar o incidente.

    6. Clique em Avançar para avançar à seção de documentação.

    7. Clique em Nome e digite um nome de política. Esse nome está incluído nas notificações e é exibido na página Políticas.

    8. (Opcional) Especifique a documentação a ser incluída nas notificações. Para formatar a documentação, use o Markdown. Para extrair informações da própria política e personalizar o conteúdo da documentação, use variáveis. Para mais informações sobre como formatar e adaptar o conteúdo desse campo, consulte Como usar o Markdown e variáveis em modelos de documentação.

      Por exemplo, a documentação pode incluir um título como Addressing High CPU Usage e detalhes que identificam o projeto:

      ## Addressing High CPU Usage
      
      This note contains information about high CPU Usage.
      
      You can include variables in the documentation. For example:
      
      This alert originated from the project ${project}, using
      the variable $${project}.
      

      O valor substitui a variável somente nas notificações. O painel Preview Markdown e os outros locais no Console do Cloud que mostram a documentação refletem somente a formatação do Markdown:

      Exemplo de gravação de uma observação de documentação usando o markdown.

      Também é possível incluir tags específicas do canal para controlar as notificações. Para mais informações, consulte Como usar os controles de canal.

  4. Clique em Save.

Interface na prévia

Para criar uma política de alertas, siga estas etapas:

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring

  2. No painel de navegação do Cloud Monitoring, selecione Alertas e clique em Criar política.

  3. Na etapa Nova condição da página Criar política de alertas, configure a condição da política de alertas.

  4. (Opcional) Para criar uma política de alertas de várias condições, faça o seguinte:

    1. Para cada condição adicional, clique em Adicionar condição e configure-a.
    2. Depois de adicionar todas as condições, selecione como elas são combinadas na etapa Gatilho de várias condições. Para mais informações, consulte Políticas com várias condições.
  5. (Opcional) Para receber uma notificação quando a condição de uma política de alertas for atendida, faça o seguinte:

    1. Verifique se a opção Usar canal de notificação está ativada na etapa Notificações e nome.
    2. Clique no texto Canais de notificação e selecione um ou mais canais no menu.

      Para informações sobre como adicionar um canal de notificação à lista de canais configurados, consulte Como criar um canal sob demanda.

      Para ver detalhes sobre as opções de canais de notificação, consulte Opções de notificação.

    3. Para ser notificado quando um incidente for encerrado, selecione Notificar sobre o encerramento do incidente.

      Por padrão, quando você cria uma política de alertas no Console do Google Cloud, uma notificação é enviada apenas quando um incidente é criado.

    É possível alterar os canais de notificação de uma política de alertas editando essa política.

  6. Opcional: se o campo Duração do fechamento automático de incidentes for exibido, atualize o valor desse campo para a duração que o Monitoring precisa aguardar antes de fechar os incidentes quando as observações deixarão de chegar. O valor padrão desse campo é sete dias.

    Por exemplo, considere uma política de alertas com uma condição de limite de métrica que monitora uma máquina virtual (VM). Se você desativar a VM enquanto um incidente estiver aberto, o Monitoring aguardará, por padrão, sete dias antes de fechar o incidente.

  7. (Opcional) Para incluir documentação personalizada com uma notificação, adicione esse conteúdo à seção Documentação da etapa Notificações e nome.

    Para formatar a documentação, use o Markdown. Para extrair informações da própria política e personalizar o conteúdo da documentação, use variáveis. Por exemplo, a documentação pode incluir um título como Addressing High CPU Usage e detalhes que identificam o projeto:

    ## Addressing High CPU Usage
    
    This note contains information about high CPU Usage.
    
    You can include variables in the documentation. For example:
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

    Quando as notificações são criadas, o Monitoring substitui as variáveis pelos valores. Os valores substituem as variáveis somente nas notificações. O painel de visualização e em outros lugares no Console do Cloud mostra apenas a formatação do Markdown:

    Exemplo de gravação de uma observação de documentação usando o markdown.

    Para informações sobre Markdown e variáveis, consulte Como usar Markdown e variáveis em modelos de documentação.

    Para mais informações sobre como incluir tags específicas do canal para controlar as notificações, consulte Como usar os controles do canal.

    É possível alterar a documentação de uma política de alertas editando essa política.

  8. (Opcional) Para alterar o nome da política de alertas de Novo alerta para algo mais significativo, acesse a etapa Notificações e nome e atualize o nome da política.

  9. Clique em Criar.

Configurar uma condição

Nesta seção, descrevemos como configurar uma condição usando a interface em prévia. Para saber mais sobre como configurar uma condição com a interface legada, consulte Como especificar condições.

Para configurar uma condição, faça o seguinte:

  1. Selecione como você quer especificar a série temporal que será monitorada:

    • Modo básico

      Use o modo básico se você quiser configurar uma condição que monitore uma métrica de um recurso específico e não quiser usar a MQL.

      É possível converter as seleções do modo básico no formato usado pelo MQL ou pelo modo de filtro direto.

      O Modo básico é o método de configuração padrão.

    • Modo MQL

      Use o modo MQL quando quiser usar o MQL para descrever a condição ou quando quiser monitorar uma proporção de métricas.

      Não é possível converter a consulta MQL para o formato usado pelo modo básico ou pelo modo de filtro direto.

    • Modo de filtro direto

      Use o modo de filtro direto quando quiser monitorar qualquer um dos seguintes itens:

      • Um objetivo de nível de serviço (SLO, na sigla em inglês)
      • A contagem de processos em execução em máquinas virtuais (VMs).
      • Uma métrica personalizada para a qual você ainda não tem dados.

      Não é possível converter uma consulta no modo de filtro direto para o formato usado pelo modo básico ou pelo MQL.

  2. Opcional: no modo básico ou de filtro direto, especifique como as séries temporais selecionadas serão processadas e combinadas usando os campos Transform data. As configurações padrão são selecionadas para a transformação de dados.

  3. Configure o Gatilho de condição.

Modo básico

Para selecionar a série temporal a ser monitorada usando o modo básico, faça o seguinte:

  1. Clique em Selecionar uma métrica na página Criar política de alertas, role até o recurso e navegue pelos menus. Depois de selecionar uma métrica, clique em Aplicar.

    Para limitar o menu às métricas que contêm uma string específica, insira essa string na barra de filtro. Por exemplo, para restringir o menu a fim de listar apenas métricas com o nome CPU na barra de filtro, insira CPU. Um teste indiferente a maiúsculas é realizado para determinar se uma métrica está listada no menu.

    Para alterar a métrica ou o recurso selecionado, expanda o menu Selecionar uma métrica e clique em Redefinir ou navegue pelos menus para fazer uma seleção diferente.

  2. (Opcional) Para monitorar apenas algumas séries temporais exibidas no gráfico, adicione um filtro. Na caixa de diálogo de filtro, use o campo Filtro para selecionar o identificador que será usado para filtrar. Por exemplo, é possível filtrar por grupo de recursos, nome, identificador de recurso, zona e identificador de métrica.

    Por exemplo, o filtro zone =~ ^us.*.a$ usa uma expressão regular para corresponder a todos os dados de série temporal em que o nome da zona começa com us e termina com a. Para mais informações, consulte Filtrar os dados selecionados.

Para abrir o Editor de consultas e pré-preencher com suas seleções, clique em MQL. Todas as modificações feitas serão descartadas quando você retornar ao modo básico.

Próxima etapa: especifique como a série temporal selecionada será processada e combinada usando os campos Transform data.

Modo MQL

Para configurar uma condição usando MQL, faça o seguinte:

  1. Clique em MQL na barra de ferramentas da página Criar alerta personalizado e insira a consulta da condição.

    A consulta precisa terminar com uma das seguintes operações:

    • Operação condition para alertas de limite.
    • Operação absent_for para alertas de ausência.

    Para mais informações, consulte Políticas de alertas com a MQL.

  2. Clique em Avançar e Configurar o gatilho de condição.

Para retornar ao modo básico, clique em Consulta básica na barra de ferramentas da página Criar alerta personalizado. Todas as modificações feitas serão descartadas quando você retornar ao modo básico.

Próxima etapa: configure o acionador de condição.

Modo de filtro direto

Para selecionar a série temporal que será monitorada usando o modo de filtro direto, faça o seguinte:

  1. Clique em ? no cabeçalho da seção Selecionar métrica e, em seguida, selecione Modo de filtro direto na dica.

  2. Insira um filtro do Monitoring.

    Por exemplo, para contar o número de processos em execução em instâncias de VM do Compute Engine com um nome que inclua nginx, digite o seguinte:

    select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
    resource.type="gce_instance"
    

    Para saber mais, acesse os recursos a seguir:

Para voltar ao modo básico, clique em ? no cabeçalho da seção Selecionar métrica e, em seguida, selecione Modo básico.

As mudanças feitas no modo de filtro direto são descartadas quando você muda para o modo MQL. Se você retornar ao modo básico depois de criar ou modificar um filtro de monitoramento, as alterações poderão não ser preservadas.

Próxima etapa: especifique como a série temporal selecionada será processada e combinada usando os campos Transform data.

Transformar dados

Esta seção se aplica apenas ao modo básico e ao modo de filtro direto. Ela não se aplica ao modo MQL.

Para configurar como cada série temporal está alinhada e como as séries temporais são combinadas, faça o seguinte:

  1. (Opcional) Para alterar como os pontos em uma série temporal são alinhados a intervalos de tempo fixos, defina a Janela de rolagem e a Função de janela de rolagem na seção Transformar dados.

    Esses campos especificam como os pontos registrados em uma janela são combinados. Por exemplo, quando a janela é de 15 minutos e a função dela é max, o ponto alinhado é o valor máximo de todas as amostras registradas nos 15 minutos mais recentes.

    Para mais informações, consulte Alinhar séries temporais.

  2. (Opcional) Para combinar séries temporais, na seção Na série temporal, clique em Mostrar mais e conclua a caixa de diálogo. Por padrão, as séries temporais não são combinadas.

    Para criar uma única série temporal, faça o seguinte:

    1. Defina o campo Agregação de séries temporais com um valor diferente de none. Por exemplo, quando você seleciona mean, cada ponto da série temporal exibida é a média de pontos da série temporal individual.

    2. O campo Agrupar por série temporal precisa estar vazio.

    Para agrupar séries temporais, faça o seguinte:

    1. Defina o campo Agregação de séries temporais com um valor diferente de none.

      Por exemplo, se você agrupar a série temporal por zone e definir o campo de agregação como mean, haverá uma série temporal para cada zona.

    2. No campo Agrupar por série temporal, selecione um ou mais identificadores que serão usados para agrupar.

    Quando você quiser que uma única série temporal seja exibida e que várias séries temporais sejam exibidas após a conclusão das etapas anteriores, combine-as usando os campos Secondary data transform.

    Para mais informações, consulte Combinar séries temporais.

Próxima etapa:configure o acionador de condição.

Gatilho de condição

Para configurar quando uma condição é atendida, acesse a página Configurar gatilho do alerta e faça o seguinte:

  1. Se o campo Tipo de condição for exibido, selecione o tipo de condição.

    • Para receber uma notificação quando os dados de métricas pararem de chegar, selecione Ausência de métrica.

    • Para receber notificações com base no valor de uma métrica, selecione Limite.

  2. Para especificar como cada série temporal contribui quando uma condição é atendida, selecione um valor no menu Gatilho do alerta. Esse menu permite especificar o subconjunto de séries temporais que precisa atender ao gatilho para que a condição seja atendida.

  3. Preencha os campos específicos da condição:

    • Condição de ausência de métrica:

      Especifique quanto tempo a política de alertas aguarda para notificar você de que nenhum dado de métrica está sendo recebido usando o campo Tempo de ausência do acionador.

    • Condição de limite:

      • Insira como o valor da métrica atende aos critérios de condição usando os campos Posição do limite, Valor do limite e Tempo acima do limite. Por exemplo, se você definir esses valores como Acima do limite, 0.3 e 5 minutes, uma série temporal atenderá à condição quando cada amostra em um intervalo de cinco minutos for maior que 0,3.

      • (Opcional) Para selecionar por quanto tempo as medições precisam atender aos critérios de condição antes que o alerta gere um incidente, clique em Opções avançadas e faça uma seleção no menu Janela de teste novamente.

        Uma única medição pode resultar em uma notificação quando você selecionar Sem teste novamente. Para informações conceituais e um exemplo, consulte Período de alinhamento e duração.

      • Opcional: para selecionar como o Monitoring avalia a condição quando os dados de séries temporais deixam de chegar, clique em Opções avançadas e faça uma seleção no menu Avaliação de dados ausentes.

        Console do Cloud
        "Avaliação de dados ausentes"
        Resumo Detalhes
        Dados ausentes vazios Os incidentes abertos permanecem abertos.
        Novos incidentes não são abertos.

        Para condições que são atendidas, a condição continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente está aberto e nenhum dado é recebido, o timer de fechamento automático é iniciado após um atraso de pelo menos 15 minutos. Se o timer expirar, o incidente será fechado.

        Para condições que não são atendidas, a condição continua não sendo atendida quando os dados param de chegar.

        Pontos de dados ausentes tratados como valores que violam a condição da política Os incidentes abertos permanecem abertos.
        É possível abrir novos incidentes.

        Para condições que são atendidas, a condição continua sendo atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele permanecerá aberto. Quando um incidente está aberto e nenhum dado chega ao período de fechamento automático mais 24 horas, o incidente é encerrado.

        Para condições que não são atendidas, essa configuração faz com que a condição de limite de métrica se comporte como uma condição de ausência de métrica. Se os dados não chegarem no horário especificado pela janela de novo teste, a condição será avaliada como atendida. Para uma política de alertas com uma condição, ela é atendida e um incidente é aberto.

        Pontos de dados ausentes tratados como valores que não violam a condição da política Os incidentes abertos estão fechados.
        Novos incidentes não são abertos.

        Para condições que são atendidas, a condição deixa de ser atendida quando os dados param de chegar. Se um incidente estiver aberto para essa condição, ele será encerrado.

        Para condições que não são atendidas, a condição continua não sendo atendida quando os dados param de chegar.

  4. (Opcional) Atualize o nome da condição.

Ver a política de alertas

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring

  2. No painel de navegação, selecione Alertas.

  3. Para ver todas as políticas e ativar a filtragem, clique em Ver todas as políticas no painel Políticas.

  4. Encontre a política que você quer visualizar e selecione-a.

Por exemplo, a captura de tela a seguir ilustra os detalhes da política de alertas chamada Test staging:

Página de detalhes da política de alertas de exemplo.

Como mostrado na imagem anterior, a página de detalhes fornece informações sobre a política de alertas:

  • Para ver os incidentes criados pela política, consulte a seção Incidentes.

  • Para ver os canais de notificação configurados, consulte a seção Canais de notificação.

  • Para ver as informações adicionais que você especificou para serem incluídas em uma notificação, consulte a seção Documentação.

  • Para ver os rótulos definidos pelo usuário, confira a seção Rótulos. Para ver exemplos de como usar rótulos para gerenciar alertas, consulte Adicionar níveis de gravidade a uma política de alertas.

  • Para editar, copiar, excluir, fazer o download da representação JSON ou alterar o estado ativado da política, use a barra de ferramentas. Por exemplo, para desativar uma política de alertas ativada, clique em Ativado e selecione Desativar.

Ver JSON para uma política de alertas

A representação JSON de uma política de alertas mostra como as configurações de política são associadas a campos na API Cloud Monitoring. Para visualizar ou fazer o download da representação JSON de uma política de alertas, faça o seguinte:

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring
  2. No painel de navegação, selecione Alertas.
  3. Encontre a política que você quer visualizar e clique no nome dela para abrir a página Detalhes da política.

  4. Escolha uma destas opções:

    • Para fazer o download do JSON no seu sistema local, clique em JSON.

    • Para visualizar o JSON, verifique se você está usando a interface de prévia, clique em Editar e, em seguida, clique em Ver código.

      Se Ver código não for exibido, você está usando a interface legada ou a opção está oculta e Mais opções de dados.

Adicionar uma política de alertas a um painel

Quando uma política de alertas contém uma condição, é possível exibir um resumo dessa política em um painel personalizado. O resumo inclui a série temporal que a política de alertas monitora, o limite e o número de incidentes abertos.

Para exibir um resumo de uma política de alertas em um painel personalizado, faça o seguinte:

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring
  2. No painel de navegação, selecione Painéis e selecione o painel que você quer visualizar ou editar.
  3. Se o botão Editar painel for exibido, clique nele.

  4. Selecione Gráfico de alertas na biblioteca de widgets ou clique em Adicionar gráfico. Em seguida, selecione Gráfico de alertas no menu.

  5. No painel de configuração do Gráfico de alertas, use o menu Política de alertas para selecionar uma política de alertas. Somente as políticas de alertas de condição única podem ser selecionadas no menu Política de alertas.

A captura de tela a seguir ilustra um gráfico de alertas:

Exemplo de um gráfico de alertas.

Neste exemplo, a política de alertas está monitorando o uso da CPU de duas máquinas virtuais diferentes. A linha tracejada mostra o limite de condição, que é definido como 50%. O ícone verde com o rótulo No incidents indica que não há incidentes abertos para a política de alertas. Se você colocar o ponteiro no ícone que mostra o número de incidentes abertos, uma caixa de diálogo será aberta direcionando para a política de alertas subjacente.

Para mais informações, consulte Como usar painéis e gráficos.

Gerencie as políticas

Para listar todas as políticas de alertas, faça o seguinte:

  1. No Console do Cloud, selecione Monitoring ou clique no botão a seguir:
    Acesse o Monitoring

  2. No painel de navegação, selecione Alertas.

    A página Alertas exibe painéis que listam informações resumidas, incidentes e políticas de alertas.

  3. Clique em Ver todas as políticas no painel Políticas.

    A página Políticas lista todas as políticas, inclui uma barra de filtro e, para cada uma, opções para editar, copiar ou excluir a política:

    • Para restringir as políticas de alertas listadas, siga um destes procedimentos:

      • Insira um nome na barra de filtro. Por exemplo, insira Example para exibir políticas com a string Example no nome. Um teste de comparação indiferente a maiúsculas é usado para determinar se um filtro está listado.
      • Clique em Políticas de filtro, selecione a propriedade de filtro e insira um valor ou selecione um valor no menu.

      Quando você tem vários filtros, um AND mescla os filtros, a menos que você insira um filtro OR. A captura de tela a seguir lista todas as políticas de alertas que correspondem a test ou My Uptime Check Alert Policy:

      Visão geral de alertas de exemplo com filtros.

    • Para editar ou copiar uma política, clique em Mais opções e selecione a opção correspondente. Editar e copiar políticas é semelhante à criação de uma política de alertas. É possível alterar e, às vezes, excluir os valores nos campos. Quando terminar, clique em Salvar política.

    • Para excluir uma política, clique em Mais opções e selecione Excluir. Na caixa de diálogo de confirmação, selecione Excluir.