Como especificar condições para políticas de alertas

As condições de uma política de alerta definem o que é monitorado e quando acionar um alerta.

Por exemplo, suponhamos que você queira definir uma política de alerta que envie um e-mail para você caso a utilização da CPU de uma instância de VM do Compute Engine permaneça acima de 80% por mais de três minutos. Você usa a caixa de diálogo de condições para especificar que quer monitorar a utilização da CPU de uma instância de VM do Compute Engine e que quer que um alerta seja acionado quando essa utilização permanecer acima de 80% por três minutos.

Antes de começar

Para abrir o painel Conditions, faça o seguinte:

  1. Acesse Stackdriver > Monitoring > Alerting > Create a Policy:

    Acessar "Create Policy"

  2. Clique em Add Condition.

Título

O campo Title é obrigatório. À medida que você preenche os campos na caixa de diálogo de condições, o campo do título é preenchido automaticamente. Altere o conteúdo preenchido automaticamente para algo mais significativo para você.

Tipo de condição

A caixa de diálogo de condições permite selecionar o tipo de condição que você está adicionando. Todas as condições incluem uma configuração que define quando um alerta ocorre, mas cada tipo de condição tem campos exclusivos:

  • Uma condição de métrica é definida por um tipo de recurso e uma métrica.
  • Uma condição de verificação de tempo de atividade é definida por um tipo de recurso e uma verificação de tempo de atividade.
  • Uma condição de integridade do processo é definida por um tipo de recurso e uma série de filtros.

No cabeçalho da guia, use as setas para rolar e clique no tipo de condição que você quer adicionar:

Adicionar ou editar uma condição

Destino

Depois de selecionar o tipo de condição, use os campos no painel Target a fim de definir valores para os campos da condição. Por exemplo, se você selecionar uma condição de métrica, o painel de destino incluirá caixas de listagem para o tipo e a métrica de recurso.

Ao selecionar um destino para qualquer tipo de política de alerta, você está selecionando um conjunto de séries temporais que precisa permanecer dentro de uma restrição. Essas séries temporais são plotadas no gráfico da condição. Para mais informações sobre séries temporais, consulte Métricas, séries temporais e recursos.

Como adicionar um objetivo de métrica

Um objetivo de métrica é definido por um tipo de recurso e uma métrica. Por exemplo, é possível selecionar a Compute Engine VM Instance e a CPU load (15m) como o tipo de recurso e a métrica, respectivamente. Para adicionar uma condição de métrica, faça o seguinte:

  1. Clique na guia Metric.

  2. Clique no campo Find resource type and metric para abrir uma lista suspensa de tipos de recursos e métricas disponíveis e selecione o tipo de recurso que você quer monitorar:

    Selecionar o tipo de recurso

  3. Depois que você seleciona o tipo de recurso, a lista só exibe métricas desse tipo de recurso. São listadas somente métricas em que há dados disponíveis. Role pelas opções de Metrics e selecione a métrica que você quer monitorar com a política:

    Selecionar a métrica

Depois de selecionar o tipo de recurso e a métrica, esta página será expandida para exibir um gráfico e fornecer funcionalidades de controle refinado sobre a condição de alerta. Consulte Como configurar uma métrica de objetivo para detalhes sobre as novas opções. Para mais informações, consulte os tópicos a seguir:

Como adicionar um objetivo de verificação de tempo de atividade

É recomendável criar uma política de alertas para uma verificação de tempo de atividade na página Monitoring > Uptime checks. Nesse caso, os campos de condição na política de alertas são preenchidos para você. Consulte Alertas de verificações de tempo de atividade para detalhes.

Como adicionar um objetivo de integridade de processo

Um objetivo de integridade do processo é definido por um tipo de recurso e uma série de filtros. Configure essa política para acionar um incidente caso o número de processos que correspondam a um padrão específico fique acima ou abaixo de um limite no decorrer de uma janela de duração. Para adicionar uma condição de integridade do processo, siga este procedimento:

  1. Clique na guia Process health.
  2. Nos campos Resource Type, conclua os seguintes passos:

    • Na lista suspensa à esquerda, selecione um único recurso, um grupo de recursos ou todos os recursos.
    • Na lista suspensa à direita, selecione o tipo de recurso que você quer monitorar. Por exemplo, convém selecionar a Compute Engine VM Instance. A IU apresenta a lista de tipos de recursos disponíveis para o sistema.
  3. Nos filtros Command Line, Command e User, selecione os campos para identificar os processos que você quer monitorar. Nesses filtros, a lista suspensa à esquerda seleciona o operador de correspondência da string e o campo direito especifica a consulta.

    • Os operadores de correspondência da string são: Equals, Contains, Starts with, Ends with e Regex. As operações diferenciam maiúsculas de minúsculas.
    • A sintaxe da consulta depende da opção de operação. Use operadores de caractere curinga em consultas. Por exemplo, o caractere curinga * corresponde a qualquer processo.

    Os resultados dos três filtros são combinados usando as seguintes regras:

    • Se você não especificar o valor de consulta para nenhum dos filtros, todos os processos serão contados.

    • Se você inserir uma consulta para um filtro, somente os processos que correspondem ao filtro serão contados.

    • Se você inserir consultas de linha de comando e de comando, os processos correspondentes a cada filtro serão contados. As linhas de comando são truncadas após 1.024 caracteres. Dessa maneira, o texto em uma linha de comando além desse limite não pode ser comparado.

    • Se você inserir uma consulta de usuário, os processos que corresponderem ao filtro do usuário e ao filtro da linha de comando ou do comando serão contados.

Exemplo

Como exemplo, para contar o número de processos com nginx em seu nome (que são de propriedade de root) em todas as instâncias de VM do Compute Engine em um projeto, é possível configurar a região Target da seguinte maneira:

  • Na lista suspensa à esquerda Resource type, selecione All e, na lista suspensa à direita, selecione Compute Engine VM Instance.
  • Na lista suspensa à esquerda Command Line, selecione Contains e, no campo à direita, insira nginx.
  • Deixe o campo à direita Command vazio.
  • Na lista suspensa à esquerda User, selecione Equals e, no campo à direita, digite root.

Mostrar nginx raiz

Na imagem anterior, o gráfico mostra um limite de alerta de um processo e dados de duas instâncias. Uma instância não tem processos que atendem às condições do filtro, diferente da outra, que tem dois.

Configuração

Depois de especificar o objetivo, você precisará indicar o que constitui uma violação das restrições no objetivo.

Use a região Configuration para definir quando a política de alerta é acionada. A região de configuração define qual série temporal pode acionar um alerta e quando essas séries temporais não estão atendendo à política.

Por exemplo, para configurar uma política de alerta a ser acionada se alguma série temporal permanecer acima de 50 por três minutos, siga estas etapas:

  • Na lista suspensa Condition triggers if, selecione Any time series violates.
  • Na lista suspensa Condition, selecione is above.
  • No campo Threshold, digite 50.
  • Na lista suspensa For, selecione 3 minutes.

    Como configurar a métrica de destino

Outras opções

Além das opções de configuração descritas no exemplo anterior, é possível especificar subconjuntos diferentes da série temporal que podem acionar o alerta e critérios diferentes para violação.

A lista suspensa Condition triggers if permite selecionar o subconjunto dos objetivos que precisam violar a condição: todas as séries temporais ou um subconjunto de séries temporais. A lista de opções inclui estes itens:

  • Any time series violates
  • Percent of time series violates
  • Number of time series violates
  • All time series violate

A lista suspensa Condition inclui as seguintes opções:

  • Is above
  • Is below
  • Increases by
  • Decreases by
  • Is absent

No exemplo anterior, a restrição será violada se uma única série temporal estiver em violação. Para os critérios de uma violação, os campos Condition são definidos como is above e 50, e a duração é de três minutos. Dessa maneira, essa política de alertas será acionada se alguma série temporal no conjunto de objetivos permanecer acima de 50 e por três minutos.

Concluir a definição da condição

Para concluir a definição da condição e retornar à caixa de diálogo da política de alertas, clique em Save.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Stackdriver Monitoring
Precisa de ajuda? Acesse nossa página de suporte.