Como gerenciar políticas de alertas com base em métricas

Neste documento, você verá como usar o Console do Google Cloud para criar e gerenciar uma política de alertas com base em métricas. Este conteúdo não se aplica a políticas de alertas baseadas em registros. Para informações sobre políticas de alertas baseadas em registros, que notificam quando uma mensagem específica aparece nos registros, consulte Como monitorar os registros.

Com uma política de alertas, é possível descrever um conjunto de condições que você queira monitorar. Essas condições podem estar relacionadas à integridade de um aplicativo, ao valor de uma métrica do sistema ou ao consumo de recursos. Por exemplo, é possível ter uma política que monitore uma verificação de tempo de atividade ou que monitore o uso da API Cloud Monitoring. Uma política de alertas também permite especificar como você quer ser notificado quando as condições da política forem atendidas e qual documentação incluir nessa notificação.

Também é possível usar a API Cloud Monitoring para criar e gerenciar políticas de alertas. Para mais informações sobre essa abordagem, consulte Como gerenciar políticas de alertas por API. Para ver as políticas representadas em JSON, consulte Políticas de amostra.

Antes de começar

Antes de criar políticas de alertas, conheça a terminologia e os conceitos gerais delas. Para mais informações sobre os componentes de uma política, o conceito de um incidente e os preços e limitações, consulte Introdução a alertas.

Crie uma política de alertas

O Cloud Monitoring está atualizando a interface que você usa para criar uma política de alertas. Este documento fornece informações sobre a interface legada e a interface de visualização. Se você escolher testar a interface de visualização e quiser usá-la, clique em Voltar para a IU legada.

Interface legada

Para criar uma política de alertas, siga estas etapas:

  1. No Console do Cloud, selecione Monitoramento:

    Acessar o Monitoramento

  2. Selecione Alertas.

  3. Clique em Criar política para ver a página Criar política de alertas:

    A caixa de diálogo Criar uma política de alertas é exibida.

    1. Clique em Adicionar condição e preencha a caixa de diálogo. Para ver informações sobre os campos em uma condição, consulte Como especificar condições.

      Uma condição descreve um recurso monitorado, uma métrica para esse recurso e quando a condição é atendida. Uma política de alertas precisa ter pelo menos uma condição. No entanto, as políticas de alertas podem conter até seis condições. Se uma política de alertas tiver exatamente uma condição e se a condição for atendida, um incidente será criado. Se uma política de alertas tiver várias condições, especifique como essas condições são combinadas. Para mais informações, consulte Políticas com várias condições.

    2. Clique em Avançar para ir para a seção de notificações.

    3. Para ser informado quando um incidente for criado, adicione um canal de notificação à sua política de alertas. É possível adicionar vários canais de notificação. Para ver detalhes sobre as opções de canais de notificação, consulte Opções de notificação.

      Para adicionar um canal de notificação, clique em Canais de notificação. Na caixa de diálogo, selecione um ou mais canais de notificação no menu e clique em OK.

      Caixa de diálogo de notificação que exibe os botões de atualização e gerenciamento de canais.

      Se um canal de notificação que você quer adicionar não estiver listado, clique em Gerenciar canais de notificação. Direcionaremos você para a página Canais de notificação em uma nova guia do navegador. Nessa página, você pode atualizar os canais de notificação configurados. Quando você tiver concluído as atualizações, retorne à guia original, clique em Atualizar e selecione os canais de notificação que serão adicionados à política de alertas. Para mais informações, consulte Como criar um canal sob demanda.

    4. (Opcional) Se você quiser receber uma notificação quando um incidente for aberto e fechado, selecione Notificar sobre o fechamento de incidente. Por padrão, as notificações são enviadas apenas quando um incidente é aberto.

      Exibição do botão de notificação no fechamento de incidentes.

    5. (Opcional) Se o campo Duração de fechamento automático de incidentes for exibido, defina o valor dele como a duração que o Monitoring aguardará antes de fechar incidentes quando as observações pararem de chegar. , O valor padrão desse campo é sete dias.

      Por exemplo, suponha que você tenha um alerta com uma condição de limite de métrica que monitore uma máquina virtual (VM). Se você desativar a VM enquanto um incidente estiver aberto, o Monitoring aguardará sete dias antes de fechar o incidente por padrão.

    6. Clique em Avançar para avançar à seção de documentação.

    7. Clique em Nome e digite um nome de política. Esse nome é incluído nas notificações e é exibido na página Políticas.

    8. (Opcional) Especifique a documentação a ser incluída nas notificações. Para formatar a documentação, use o Markdown. Para extrair informações da própria política e personalizar o conteúdo da documentação, use variáveis. Para mais informações sobre como formatar e adaptar o conteúdo desse campo, consulte Como usar o Markdown e variáveis em modelos de documentação.

      Por exemplo, a documentação pode incluir um título como Addressing High CPU Usage e detalhes que identificam o projeto:

      ## Addressing High CPU Usage
      
      This note contains information about high CPU Usage.
      
      You can include variables in the documentation. For example:
      
      This alert originated from the project ${project}, using
      the variable $${project}.
      

      O valor substitui a variável apenas nas notificações. O painel Visualizar Markdown e os outros locais no Console do Cloud que mostram a documentação refletem somente a formatação do Markdown:

      Exemplo de gravação de uma observação de documentação usando o markdown.

      Também é possível incluir tags específicas do canal para controlar as notificações. Para mais informações, consulte Como usar os controles de canal.

  4. Clique em Save.

Interface de visualização

Para criar uma política de alertas, siga estas etapas:

  1. No Console do Cloud, selecione Monitoramento:

    Acessar o Monitoramento

  2. No painel de navegação do Cloud Monitoring, selecione Alertas e clique em Criar política.

  3. Na etapa Nova condição da página Criar política de alertas, configure a condição da política de alertas.

  4. (Opcional) Para criar uma política de alertas de várias condições, faça o seguinte:

    1. Para cada condição adicional, clique em Adicionar condição e configure-a.
    2. Depois de adicionar todas as condições, selecione como elas são combinadas na etapa Acionador de várias condições. Para mais informações, consulte Políticas com várias condições.
  5. (Opcional) Para ser notificado quando a condição de uma política de alertas for atendida, ative Usar canal de notificação na etapa Notificações e nome. Em seguida, faça o seguinte:

    1. Clique no texto Canais de notificação para ativar um menu. Selecione um ou mais canais de notificação nesse menu.

      Se um canal de notificação que você quer adicionar não estiver listado, consulte Como criar um canal sob demanda.

      Para ver detalhes sobre as opções de canais de notificação, consulte Opções de notificação.

    2. Para receber uma notificação quando um incidente for resolvido, selecione Notificar sobre o fechamento de incidente.

      Por padrão, se você criar uma política de alertas com o Console do Google Cloud, uma notificação será enviada apenas quando um incidente for criado.

    É possível alterar os canais de notificação de uma política de alertas editando essa política.

  6. (Opcional) Se o campo Duração de fechamento automático de incidentes for exibido, defina o valor dele como a duração que o Monitoring aguardará antes de fechar incidentes quando as observações pararem de chegar. , O valor padrão desse campo é sete dias.

    Por exemplo, se você tiver um alerta com uma condição de limite de métrica que monitore uma máquina virtual (VM). Se você desativar a VM enquanto um incidente estiver aberto, por padrão, o Monitoring aguardará sete dias antes de encerrar o incidente.

  7. (Opcional) Para incluir documentação personalizada com uma notificação, adicione esse conteúdo à seção Documentação da etapa Notificações e nome.

    Para formatar a documentação, use o Markdown. Para extrair informações da própria política e personalizar o conteúdo da documentação, use variáveis. Por exemplo, a documentação pode incluir um título como Addressing High CPU Usage e detalhes que identificam o projeto:

    ## Addressing High CPU Usage
    
    This note contains information about high CPU Usage.
    
    You can include variables in the documentation. For example:
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

    Quando as notificações são criadas, o Monitoring substitui as variáveis pelos valores delas. Os valores substituem as variáveis somente em notificações. O painel de visualização e, em outros lugares no Console do Cloud, mostram apenas a formatação do Markdown:

    Exemplo de gravação de uma observação de documentação usando o markdown.

    Para mais informações sobre Markdown e variáveis, consulte Como usar Markdown e variáveis em modelos de documentação.

    Para informações sobre como incluir inclusão de tag específica do canal para controlar notificações, consulte Como usar controles de canal.

    É possível alterar a documentação de uma política de alertas editando essa política.

  8. (Opcional) Para alterar o nome da política de alertas de Novo alerta para algo mais significativo, acesse a etapa Notificações e nome e atualize a política. nome.

  9. Clique em Criar.

Configurar uma condição

Nesta seção, descrevemos como configurar uma condição usando a interface de visualização. Se você estiver usando a interface legada, consulte Como especificar condições.

Para configurar uma condição, faça o seguinte:

  1. Selecione como você quer especificar a série temporal a ser monitorada:

    • Modo básico

      Use o modo básico quando quiser configurar uma condição que monitore uma métrica de um recurso específico e não queira usar MQL.

      Se você selecionar o modo básico, poderá converter suas seleções em MQL ou no modo de filtro direto.

    • Modo MQL

      Use o modo MQL quando quiser usar MQL para descrever a condição ou se quiser monitorar uma proporção de métricas.

      Se você usar o modo MQL, a consulta não poderá ser convertida para os modos básico ou direto.

    • Modo de filtro direto

      Use o modo de filtro direto quando tiver interesse em monitorar qualquer um dos seguintes itens:

      • Um objetivo de nível de serviço (SLO).
      • A contagem de processos em execução em máquinas virtuais (VMs).
      • Uma métrica personalizada para a qual você ainda não tem dados.

      Se você usar o modo de filtro direto, sua consulta não poderá ser convertida para o modo básico ou para uma consulta MQL.

  2. (Opcional) Se você usar o modo básico ou o modo de filtro direto, especifique como as séries temporais selecionadas são processadas e combinadas usando os campos Transformar dados.

  3. Configure o acionador de condição.

Modo básico

Para selecionar a série temporal a ser monitorada usando o modo básico, faça o seguinte:

  1. Clique em Selecionar uma métrica na página Criar política de alertas, role até o recurso e navegue pelos menus. Depois de selecionar uma métrica, clique em Aplicar.

    Para limitar o menu às métricas que contêm uma string específica, insira essa string na barra de filtro. Por exemplo, se você digitar CPU, apenas as métricas com nome contendo CPU serão exibidas. Um teste que diferencia maiúsculas e minúsculas é realizado para determinar se uma métrica está listada no menu.

    Para alterar a métrica ou o recurso selecionado, expanda o menu Selecionar uma métrica e clique em Redefinir ou navegue pelos menus para fazer uma seleção diferente.

  2. (Opcional) Para monitorar somente algumas das séries temporais exibidas no gráfico, adicione um filtro. Na caixa de diálogo de filtro, use o campo Filtrar para selecionar o rótulo que será filtrado. Por exemplo, é possível filtrar por grupo de recursos, nome, rótulo de recurso, zona, rótulo de métrica.

    Por exemplo, o filtro zone =~ ^us.*.a$ usa uma expressão regular para corresponder a todos os dados de série temporal cujo nome da zona começa com us e termina com a. Veja mais informações em Filtrar os dados selecionados.

Se você clicar em MQL na barra de ferramentas depois de fazer as seleções, o Editor de consultas será aberto e exibirá uma consulta que inclui suas seleções. Se você modificar a consulta existente e, em seguida, retornar ao modo básico, as modificações serão descartadas.

Modo MQL

Para configurar uma condição usando o MQL, faça o seguinte:

  1. Clique em MQL na barra de ferramentas da página Criar alerta personalizado e insira a consulta para a condição.

    Sua consulta precisa terminar com uma das seguintes operações:

    • Operação condition para alertas de limite.
    • Operação absent_for para alertas de ausência.

    Para mais informações, consulte Políticas de alertas com MQL.

  2. Clique em Avançar e Configurar o gatilho de condição.

Para retornar ao modo básico, clique em Consulta básica na barra de ferramentas da página Criar alerta personalizado.

Se você criar uma consulta ou modificar a consulta existente e retornar ao modo básico, as modificações serão descartadas.

Modo de filtro direto

Para selecionar a série temporal a ser monitorada usando o modo de filtro direto, faça o seguinte:

  1. Clique em ? no cabeçalho da seção Selecionar métrica e, em seguida, selecione Modo de filtro direto na dica.

  2. Digite um filtro do Monitoring.

    Por exemplo, para contar o número de processos em execução nas instâncias de VM do Compute Engine com nomes que incluem nginx, digite o seguinte:

    select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
    resource.type="gce_instance"
    

    Para informações de sintaxe, consulte os seguintes recursos:

Para voltar ao modo básico, clique em ? no cabeçalho da seção Selecionar métrica e, em seguida, selecione Modo básico.

Se você fizer seleções usando o modo básico e entrar no modo de filtro direto, poderá visualizar o filtro de monitoramento. É possível retornar ao modo básico sem modificar o filtro de monitoramento. Se você voltar ao modo básico após criar ou modificar um filtro de monitoramento, as alterações não serão preservadas.

Se você usar o modo de filtro direto para selecionar a série temporal a ser monitorada e alternar para o modo MQL, as alterações não serão preservadas.

Transformar dados

Esta seção se aplica apenas ao modo básico e ao modo de filtro direto. Ele não se aplica ao modo MQL.

Para configurar como cada série temporal está alinhada e como as séries temporais são combinadas, faça o seguinte:

  1. (Opcional) Para alterar como os pontos de uma série temporal estão alinhados a intervalos de tempo fixos, defina a Janela contínua e a Função de janela contínua na Transformação de dados.

    Esses campos especificam como os pontos registrados em uma janela são combinados. Por exemplo, se a janela for de 15 minutos e a função da janela for max, o ponto alinhado será o valor máximo de todas as amostras registradas nos 15 minutos mais recentes.

    Para mais informações, consulte Alinhar as séries temporais.

  2. (Opcional) Para combinar séries temporais na seção Várias séries temporais, clique em Mostrar mais e conclua a caixa de diálogo. Por padrão, as séries temporais não são combinadas.

    Para criar uma única série temporal, faça o seguinte:

    1. Defina o campo Agregação da série temporal como um valor diferente de none. Por exemplo, se você selecionar mean, cada ponto na série temporal exibida será a média de pontos da série temporal individual.

    2. Verifique se o campo Agrupar a série temporal por está vazio.

    Para agrupar séries temporais, faça o seguinte:

    1. Defina o campo Agregação da série temporal como um valor diferente de none.

      Por exemplo, se você agrupar a série temporal por zone e, em seguida, definir o campo de agregação como mean, haverá uma série temporal para cada zona.

    2. No campo Agrupar por série temporal, selecione um ou mais rótulos para agrupar.

    Se várias séries temporais forem exibidas após a conclusão das etapas anteriores, para combinar essas séries temporais em uma única série temporal, use os campos de Transformação de dados secundários.

    Para mais informações, consulte Combinar séries temporais.

Acionador de condição

Para configurar quando uma condição é atendida, acesse a página Configurar gatilho de alerta e faça o seguinte:

  1. Se o campo Tipo de condição for exibido, selecione o tipo de condição.

    • Para receber notificações quando os dados de métricas forem interrompidos, selecione Ausência de métrica.

    • Para receber notificações com base no valor de uma métrica, selecione Limite.

  2. Para especificar como uma série temporal individual contribui quando uma condição é atendida, selecione um valor no menu Acionador do alerta. Esse menu permite especificar o subconjunto de séries temporais que precisam satisfazer o gatilho para que a condição seja atendida.

  3. Preencha o campo específico da condição:

    • Condição de ausência de métrica

      Insira o tempo que a política de alertas aguarda para notificar você de que nenhum dado de métrica está sendo recebido usando o campo Acionar quando não há dados por esse período.

    • Condição Threshold

      Insira como o valor da métrica atende aos critérios da condição usando Posição do limite, Valor do limite e Tempo acima do limite. Por exemplo, se você definir esses valores como Acima do limite, 0.3 e 5 minutes, uma série temporal atenderá à condição se todas as amostras em uma o intervalo de minutos é maior que 0,3.

      Digite por quanto tempo as medidas precisam atender aos critérios de condição antes de gerar alertas para um incidente usando a janela "Retest". Se você selecionar valor mais recente, uma única medição poderá resultar em uma notificação. Para informações conceituais e um exemplo, consulte O período de alinhamento e a duração.

JSON para políticas de alertas

Para visualizar ou fazer o download da representação JSON de uma política de alertas, faça o seguinte:

  1. No Console do Cloud, selecione Monitoramento:

    Acessar o Monitoramento

  2. Selecione Alerta, encontre a política que você quer visualizar e abra a página Detalhes da política.

  3. Siga uma das seguintes ações:

    • Para fazer o download do JSON para seu sistema local, clique em JSON.

    • Para visualizar o JSON, verifique se você está usando a interface de visualização, clique em Editar e, em seguida, clique em código de visualização.

      Se o código da visualização não for exibido, significa que você está usando a interface legada ou a opção está oculta em Mais opções.

Adicionar uma política de alertas a um painel

Quando uma política de alertas contém uma condição, é possível exibir um resumo dela em um painel personalizado. O resumo inclui a série temporal que a política de alertas monitora, o limite e o número de incidentes abertos.

Para exibir o resumo de uma política de alertas em um painel personalizado, faça o seguinte:

  1. No Console do Cloud, selecione Monitoramento:

    Acessar o Monitoramento

  2. Selecione Painéis e abra o painel personalizado que você quer modificar.

  3. Se Edição não for exibida, clique em Como visualizar e selecione Alternar para o modo de edição. }.

  4. Selecione Gráfico de alerta na biblioteca de widgets ou clique em Adicionar gráfico e selecione Gráfico de alerta no menu.

  5. No painel de configuração do Gráfico de alertas, use o menu Política de alertas para selecionar uma política de alertas. Somente políticas de alertas de condição única podem ser selecionadas no menu Política de alertas.

A captura de tela a seguir ilustra um gráfico de alerta:

Exemplo de um gráfico de alertas.

Neste exemplo, a política de alertas está monitorando o uso da CPU de duas máquinas virtuais diferentes. A linha vermelha tracejada mostra o limite de condição, que é definido como 50%. O ícone verde com o rótulo No incidents indica que não há incidentes abertos para a política de alertas. Se você colocar o ponteiro no chip que mostra o número de incidentes abertos, uma caixa de diálogo será aberta com um link para a política de alerta subjacente.

Para mais informações, consulte Como usar painéis e gráficos.

Gerencie as políticas

Para listar todas as políticas de alertas, faça o seguinte:

  1. No Console do Cloud, selecione Monitoramento:

    Acessar o Monitoramento

  2. Selecione Alertas.

  3. Uma lista parcial de políticas é mostrada no painel Políticas. Para ver todas as políticas e ativar a filtragem, clique em Ver todas as políticas.

Para visualizar os detalhes de uma política de alertas, clique em seu nome.

Para restringir as políticas de alerta listadas, adicione filtros. Cada filtro é composto por um nome e um valor. É possível definir o valor como uma correspondência exata para um nome de política ou uma correspondência parcial. Os filtros não executam comparações que diferenciam maiúsculas de minúsculas. Se você tiver vários filtros, um AND lógico se unirá aos filtros, a menos que você insira um filtro OR. A captura de tela a seguir lista todas as políticas de alertas que correspondem a test ou My Uptime Check Alert Policy:

Visão geral de alertas de exemplo com filtros.

Na página Políticas, é possível editar, excluir, copiar, ativar ou desativar uma política de alertas:

  • Para editar ou copiar uma política, clique em Mais opções e selecione a opção correspondente. Editar e copiar políticas é semelhante à criação de uma política de alertas. É possível alterar e, às vezes, excluir os valores nos campos. Quando terminar, clique em Salvar.

  • Para excluir uma política, clique em Mais opções e selecione Excluir. Na caixa de diálogo de confirmação, selecione Excluir.

  • Para alterar o status ativado da política de alertas, clique no botão localizado abaixo do título Ativado.

Se você selecionar uma política de alertas, os detalhes da política serão exibidos. Por exemplo, a captura de tela a seguir ilustra os detalhes da política de alertas chamada Test staging:

Página de detalhes da política de alertas de exemplo.

Na seção Notificações, você vê se uma política foi configurada para notificá-lo quando incidentes foram fechados. Você sempre receberá notificações quando um incidente for aberto. Para alterar o comportamento de notificação, edite a política de alertas.

É possível editar, excluir, copiar, ativar ou desativar uma política de alertas na página Detalhes da política. Por exemplo, para desativar uma política de alertas ativada, clique em Ativada e selecione Desativar. Da mesma forma, para ativar uma política desativada, clique em Desativada.