Pode criar políticas de alerta nos seus objetivos ao nível do serviço (SLOs) para saber se corre o risco de violar um SLO. Seleciona o SLO que quer monitorizar e, em seguida, configura uma política de alerta para monitorizar esse SLO. Normalmente, a condição é expressa através da seleção de um valor limite que constitui uma violação e um período durante o qual a violação é permitida. Se o limite for excedido durante mais tempo do que o período permitido, a política de alertas é acionada.
Esta página descreve os alertas sobre a taxa de consumo do seu orçamento de erros. Não aborda as políticas de alerta em detalhe. Parte do princípio de que já conhece os conceitos básicos das condições e dos canais de notificação.
Para ver informações gerais sobre as políticas de alerta e como criá-las, consulte o artigo Usar políticas de alerta.
Para ver passos específicos sobre como criar uma política de alerta baseada em SLOs, consulte o seguinte:
- Criar uma política de alertas através da Google Cloud consola.
- Criar uma política de alerta através da API Cloud Monitoring.
Taxa de consumo da margem de erro
A sua margem de erro para um período de conformidade é (1 − objetivo de SLO) × (eventos elegíveis no período de conformidade). Se o seu objetivo de SLO for de 95%, é aceitável que 5% dos eventos medidos pelo seu SLI falhem antes de o objetivo de SLO ser perdido.
A velocidade de consumo indica a rapidez com que está a consumir a sua margem de erro durante um período de conformidade. A taxa de consumo depende do número de eventos elegíveis e do número de eventos de erro recebidos no período de conformidade. Por exemplo, se não ocorrerem eventos de erro, a margem de erro não está a ser consumida e a taxa de consumo é zero. Para ver um exemplo que ilustra como pode calcular o tempo de inatividade máximo de um serviço, consulte o artigo Alerta sobre a taxa de consumo.
A métrica de taxa de consumo é normalizada de modo que uma taxa de consumo superior a um indica que, se a taxa de erro medida for mantida durante qualquer período de conformidade futuro, o serviço estará fora do ANS para esse período. Para mais informações, consulte o artigo Orçamentos de erros.
A métrica de taxa de consumo é obtida pelo seletor de intervalos temporais
select_slo_burn_rate
. Uma política de alerta de taxa de consumo envia-lhe uma notificação quando o seu orçamento de erros é consumido mais rapidamente do que um limite que define, medido durante o período de conformidade do alerta. Existem outros seletores de séries cronológicas. Consulte o artigo
Obter dados de SLO para mais informações.
Pode criar políticas de alerta que usam alguns destes outros seletores de séries cronológicas, mas tem de os criar através da API Cloud Monitoring.
Vista geral da criação de uma política de alerta num SLO
A criação de uma política de alerta para um SLO é semelhante à criação de uma política de alerta para métricas. Esta secção revê os passos gerais para criar uma política de alerta.
Para criar uma política de alerta para um SLO, siga estes passos:
Identifique o SLO no qual quer basear a política de alerta.
Crie uma condição para a sua política de alerta que use o SLO escolhido. Na condição, especifica um seletor de séries cronológicas a usar na obtenção de dados de SLO. Também especifica uma duração, um limite e uma comparação que determinam quando o SLO está em incumprimento.
Por exemplo, se usar o seletor de séries cronológicas para a velocidade de consumo, os dados obtidos refletem a velocidade de consumo da margem de erro para o SLO escolhido.
A condição também é onde especifica o limite e a duração das violações do SLO antes de acionar um alerta. Por exemplo, quer que a taxa de consumo seja um determinado valor acima da taxa desejada durante um determinado período antes de acionar um alerta. O valor de "alguma quantia superior a" é o limite da condição e o valor de "algum período" é a duração da condição.
Identifique ou crie um canal de notificação para usar na sua política de alertas.
Faculte documentação que explique aos utilizadores o que acionou a política de alertas.
Para ver informações gerais sobre as políticas de alerta e como criá-las, consulte o artigo Usar políticas de alerta.
Políticas de alerta e períodos de análise retrospetiva
Quando obtém os dados de SLO para uma política de alerta, especifica um identificador para o SLO e um período de análise retrospetiva. O período de análise determina o intervalo de tempo passado a partir do qual os dados são obtidos. É fundamental que o período de análise também seja usado como o período de conformidade para calcular o desempenho do SLO e a margem de erro.
Atualmente, não é possível basear os alertas na taxa de consumo da margem de erro de um SLO com um período de conformidade superior a 24 horas. Em muitos casos, aproximar o período de conformidade de longo prazo (por exemplo, de 28 ou 30 dias) com um período inferior a 24 horas é suficiente para detetar interrupções e impulsionar a sua resposta operacional de curto prazo às mesmas.
Os períodos de conformidade mais curtos permitem uma deteção mais rápida de problemas, mas com a ressalva de que as grandes alterações no tráfego e nas taxas de erro ao longo de um dia podem resultar em alertas excessivamente sensíveis durante períodos de baixo tráfego. Considere usar um limite de taxa de consumo significativamente superior a 1 para reduzir a sensibilidade dos alertas durante estes períodos.
Tipos de alertas de orçamento de erros
Quando configurar políticas de alerta para monitorizar o seu orçamento de erros, é uma boa ideia configurar duas políticas de alerta relacionadas:
Alerta de consumo rápido, que avisa sobre uma alteração súbita e grande no consumo que, se não for corrigida, vai esgotar o seu orçamento de erros muito em breve. "A este ritmo, vamos esgotar o orçamento de erros de todo o mês em dois dias!"
Para um alerta de esgotamento rápido, use um período de análise mais curto para receber uma notificação rapidamente se surgir uma condição potencialmente desastrosa e persistir, mesmo que brevemente. Se for verdadeiramente desastroso, não vai querer esperar muito para o notar.
O limite para a taxa de consumo sobre a qual recebe alertas aqui é muito superior ao ideal de referência para o período de análise.
Alerta de consumo lento, que avisa sobre uma taxa de consumo que, se não for alterada, esgota o seu orçamento de erros antes do fim do período de conformidade. Este tipo de condição é menos urgente do que uma condição de publicação rápida. "Estamos ligeiramente acima do que gostaríamos de ter neste momento do mês, mas ainda não estamos em grandes dificuldades."
Para um alerta de crescimento lento, use um período de análise mais longo para suavizar as variações no consumo a curto prazo.
O limite para o qual recebe um alerta de gasto lento é superior ao desempenho ideal para o período de análise, mas não significativamente superior. Uma política baseada num período de análise mais curto com um limite elevado pode gerar demasiados alertas, mesmo que os níveis de consumo a longo prazo sejam equilibrados. No entanto, se o consumo permanecer, mesmo que ligeiramente, demasiado elevado durante um período mais longo, acaba por consumir todo o seu orçamento de erros.
Passos seguintes
- Para criar uma política de alerta baseada em SLOs através da Google Cloud consola, consulte o artigo Criar uma política de alerta (Google Cloud consola).
- Para criar uma política de alertas baseada em SLOs através da API Monitoring, consulte o artigo Criar uma política de alertas (API).