Vista geral dos objetivos ao nível do serviço
Os objetivos ao nível do serviço (SLOs) são uma ferramenta essencial no conjunto de ferramentas de monitorização de serviços da Google. Os SLOs podem dar-lhe um sinal conciso e com pouco ruído quanto ao estado geral dos seus serviços. O Cloud Service Mesh permite-lhe definir SLOs para os seus serviços e monitorizar e enviar alertas sobre os seus serviços em função desses SLOs.
Para monitorizar o estado de funcionamento de um serviço, tem de compreender que comportamentos são importantes para esse serviço e como medir e avaliar esses comportamentos. Um indicador do nível de serviço (INS) é uma medida quantitativa de um determinado aspeto do serviço. Os SLIs típicos são:
- Latência: tempo que demora a devolver uma resposta a um pedido, normalmente medido em milissegundos (ms). Normalmente, a latência é apresentada como um valor agregado. Ou seja, os dados não processados são recolhidos durante um período e calculados como percentis. O Cloud Service Mesh apresenta um gráfico de latência na página Métricas para cada um dos seus serviços. O gráfico de latência mostra a latência ao longo do tempo, o que pode ajudar a determinar um limite de latência ou um limite superior para um serviço.
- Disponibilidade: a fração do tempo em que um serviço responde com êxito. Normalmente, é apresentado como uma relação entre o número de respostas bem-sucedidas e o número total de respostas. O gráfico Taxa de erros na página Métricas pode ajudar a determinar a disponibilidade de cada serviço.
Um SLO é um valor alvo para um nível de serviço que é medido por um INS. Um SLO pode ser representado como: SLI ≤ upper_bound
ou SLI ≥ lower_bound
. Os NDSs são objetivos mensuráveis para o desempenho ao longo de um período. Por exemplo, pode ter requisitos como os seguintes para alguns dos seus serviços:
- A latência só pode exceder 300 ms em 5% dos pedidos num período de 30 dias consecutivos.
- O sistema tem de ter uma disponibilidade de 99% medida ao longo de uma semana civil.
Pode definir e ver SLOs para os seus serviços com base nos respetivos dados de telemetria na página Estado. Em seguida, pode criar alertas no Cloud Monitoring para receber um aviso se um serviço não estiver a ter o desempenho esperado.
O que se segue?
Saiba mais sobre os SLOs a partir da engenharia de fiabilidade de sites na Google: