Configurações de políticas de alertas comuns

Para criar uma política de alertas, é preciso descrever o que será monitorado, quando a política será acionada e como você prefere ser notificado. Esta página contém as configurações que podem ser usadas para criar políticas de alertas. Cada seção desta página tem os seguintes elementos:

  • Título: lista o nome do produto relevante e traz uma breve descrição da política de alertas.
  • Resumo: uma breve descrição da política de alertas. Para mais informações, consulte a documentação do produto.
  • Etapas para criar uma política de alertas: resumo das etapas necessárias para criar uma política de alertas. Para informações detalhadas sobre essas etapas, consulte Como criar uma política de alertas.
  • Campos do painel de destino: esses campos especificam o que está sendo monitorado e como os dados são agregados. Se você estiver usando o Console do Google Cloud, estes campos são aqueles localizados no painel Destino da caixa de diálogo Adicionar condição.
  • Campos de configuração: esses campos especificam quando a política de alertas é acionada. Se você estiver usando o Console do Google Cloud, estes campos são aqueles localizados no painel Configuração da caixa de diálogo Adicionar condição.

Use as configurações na tabela do painel de destino quando criar um gráfico ou usar o Metrics Explorer.

Ambiente de execução do BigQuery

Para criar uma política de alertas que seja acionada quando o 50º percentil do tempo de execução de uma consulta do BigQuery exceder um limite definido pelo usuário, use as configurações abaixo:

Campo do painel
Valor desejado

Valor
Resource type Global
Metric Query execution time
Filter
Aggregator none
Advanced Aggregation Aligner: 50th percentile
Alignment Period: 1 m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Você determina o valor aceitável. Para essa métrica, considere um limite que é, aproximadamente, o dobro do valor médio do 50º percentil.
For 1 minute

Uso do BigQuery

Para criar uma política de alertas que é acionada quando as métricas do BigQuery ingeridas ultrapassam um nível definido pelo usuário, faça o seguinte:

Campo do painel
Valor desejado

Valor
Resource type Insira BigQuery Dataset
Metric As métricas específicas para o uso incluem Stored bytes, Uploaded bytes e Uploaded bytes billed. No entanto, essa é apenas uma lista parcial. Para uma lista completa das métricas disponíveis, consulte métricas do BigQuery.
Filter project_id: código do projeto do Google Cloud.
dataset_id: código do conjunto de dados.
Group By dataset_id: código do conjunto de dados.
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 1 m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Você determina o valor aceitável.
For 1 minute

Validação de inicialização antecipada do Compute Engine

A validação de inicialização antecipada mostra o status de aprovação/reprovação da parte de inicialização antecipada da última sequência de inicialização. A inicialização antecipada é a sequência que vai desde quando o firmware UEFI inicia até o momento em que ele passa o controle para o carregador de inicialização.

Para criar uma política de alertas que é acionada quando há falha na sequência de inicialização antecipada para qualquer uma das suas instâncias de VM do Compute Engine, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type GCE VM Instance
Metric Early boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation Use padrões.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Validação de inicialização atrasada do Compute Engine

A validação de inicialização atrasada mostra o status de aprovação/reprovação da parte de inicialização atrasada da última sequência de inicialização. Inicialização atrasada é a sequência do carregador de inicialização até a conclusão. Isso inclui o carregamento do kernel do sistema operacional.

Para criar uma política de alertas que é acionada quando há falha na sequência de inicialização atrasada para qualquer uma das suas instâncias de VM do Compute Engine, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type GCE VM Instance
Metric late boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation Use padrões.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Como registrar bytes de registro mensais ingeridos

Para criar uma política de alertas que seja acionada quando os bytes de registro ingeridos mensalmente excederem o limite definido pelo usuário para o Cloud Logging, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type Global
Metric Monthly log bytes ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Você determina o valor aceitável.
For O valor mínimo aceitável é de 30 minutos.

Previsão do Recommendations AI

Para configurar um alerta de previsão do Recommendations AI, use as seguintes configurações na política de alertas:

Campo do painel
Valor desejado

Valor
Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 5 minutes

Redução do registro de eventos do usuário no Recommendations AI

Para configurar um alerta de redução do registro de eventos no Recommendations AI, use as seguintes configurações na política de alertas:

Campo do painel
Valor desejado

Valor
Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is absent
Threshold
For 10 minutes

Uso de CPU de alta prioridade no Spanner

Para criar uma política de alertas que é acionada quando o uso de CPU de alta prioridade para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Aggregator max
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/utilization_by_priority.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 45% para instâncias multirregionais.
65% para instâncias regionais.
For 10 minutes

Uso contínuo de 24 horas do Spanner

Para criar uma política de alertas que é acionada quando a média contínua de 24 horas de utilização da CPU para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/smoothed_utilization.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Armazenamento do Spanner

Para criar uma política de alertas que é acionada quando o armazenamento da sua instância do Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/storage/used_bytes.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Defina o limite para 75% do armazenamento máximo por nó, multiplicado pelo número de nós. Para os limites de nó atuais, consulte Cotas e limites do Cloud Spanner.

Para um limite de 2 TB por nó, o limite recomendado é:

1649267441664 multiplicado pelo número de nós na instância.
For 10 minutes

Trace acima da cota de uso da API

Para criar uma política de alertas que é acionada quando os períodos mensais ingeridos do Cloud Trace ultrapassam sua cota, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type Consumed API
Metric Request count
Filter service = cloudtrace.googleapis.com
response_code = 429
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Monitor do Trace para uso mensal de períodos

Para criar uma política de alertas acionada quando os períodos mensais do Cloud Trace ingeridos excederem um limite definido pelo usuário, use estas configurações:

Campo do painel
Valor desejado

Valor
Resource type global
Metric Monthly trace spans ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Você determina o valor aceitável.
For O valor mínimo aceitável é de 30 minutos.

Erros de exportação de rastreamento

Para criar uma política de alertas que será acionada se houver erros na exportação de dados do Cloud Trace para o BigQuery, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type Cloud Trace
Metric Spans Exported to BigQuery
Filter status != ok
Group by status
Aggregator sum
Advanced Aggregation Aligner: rate
Alignment Period: 1 m
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Monitoramento das verificações de tempo de atividade

Para criar uma política de alertas para uma verificação de tempo de atividade ou criar um gráfico que exiba o status de sucesso ou latência de uma verificação de tempo de atividade, consulte Alertas de verificações de tempo de atividade.