Sobre proporções de métricas

Neste documento, ajudamos você a escolher a melhor abordagem para criar um gráfico ou monitorar uma proporção de dados de métricas. Ele também inclui links para exemplos, identifica quando é possível calcular proporções e descreve anomalias que podem ser encontradas ao criar um gráfico com uma proporção de duas métricas diferentes. Essas anomalias são devido a diferenças na taxa de amostragem ou nos parâmetros de alinhamento.

As proporções permitem transformar os dados da métrica em um formato diferente e potencialmente mais útil. Por exemplo, pense em um tipo de métrica que conta o número de respostas HTTP por código de resposta. Os dados da métrica informam o número de erros, mas não a proporção de solicitações que falharam. No entanto, os requisitos de desempenho geralmente são especificados como uma porcentagem, como "A taxa de erro precisa ser menor que 0,1%". Para determinar a taxa de erros usando os dados da métrica, calcule a proporção de solicitações que falharam em relação ao número total de solicitações.

Práticas recomendadas

Para monitorar ou criar um gráfico de uma proporção de dados de métrica, recomendamos usar a Linguagem de consulta do Monitoring (MQL, na sigla em inglês). É possível usar o MQL com a API Cloud Monitoring e com o console do Google Cloud. O console do Google Cloud inclui um editor de código que oferece sugestões, detecção de erros e outro suporte para criar consultas MQL válidas. Para mais informações e exemplos, consulte os seguintes documentos:

Para criar uma política de alertas que monitore uma proporção de métricas quando você não estiver familiarizado com o MQL, use a API Cloud Monitoring e inclua um filtro de série temporal. Para ver um exemplo, consulte Proporção da métrica.

Para criar um gráfico de uma proporção de dados de métrica quando você não está familiarizado com o MQL, recomendamos que você use o console do Google Cloud e uma interface orientada por menu. Para instruções detalhadas, consulte Criar um gráfico com uma proporção de métricas e Adicionar gráficos e tabelas a um painel personalizado.

Restrições com proporções

Quando você configura uma proporção, as seguintes restrições se aplicam:

  • Após a agregação, os rótulos na série temporal do denominador precisam ser os mesmos ou um subconjunto deles.

    Recomendamos selecionar as opções de agregação de modo que, após a agregação, a série temporal do numerador e do denominador tenha os mesmos rótulos.

    Considere uma configuração em que a série temporal do numerador tenha os rótulos method, quota_metric e project_id. A série temporal do denominador tem rótulos limit_name, quota_metric e project_id. As escolhas válidas para o agrupamento de denominadores dependem das seleções do numerador:

    • Numerador agrupado pelo rótulo method: Combine a série temporal do denominador em uma única série temporal. Nenhum outro agrupamento faz com que os rótulos da série temporal do denominador sejam um subconjunto dos rótulos da série temporal do numerador.
    • Numerador agrupado pelo rótulo quota_metric: agrupe o denominador por esse rótulo ou combine todas as séries temporais no denominador em uma única série temporal.
    • Numerador agrupado pelos rótulos quota_metric e project_id: agrupe o denominador pelos dois rótulos, por um rótulo, ou combine a série temporal do denominador em uma única série temporal.

    As opções de agregação de um denominador válido sempre eliminam o rótulo limit_name da série temporal agrupada porque ele não está presente na série temporal do numerador.

    Para conferir, consulte Exemplos de política de alertas MQL.

  • O período de alinhamento precisa ser o mesmo para o numerador e o denominador ao configurar um gráfico usando o console do Google Cloud. No entanto, esses campos podem ser diferentes ao usar a API Cloud Monitoring.

    Recomendamos que você use o mesmo período de alinhamento para o numerador e o denominador, independentemente da ferramenta usada para criar o gráfico.

  • O numerador e o denominador precisam ter o mesmo tipo de valor. Por exemplo, quando o numerador é do tipo DOUBLE, o denominador também precisa ser do tipo DOUBLE.

    As proporções exigem que a métrica do numerador e do denominador tenha um tipo de valor DOUBLE ou INT64.

  • A série temporal alinhada para o numerador e o denominador precisa ter o mesmo tipo de métrica. Quando as duas métricas têm tipos diferentes, é necessário usar alinhadores para convertê-las ao mesmo tipo.

    Considere uma configuração em que uma métrica DELTA é selecionada para o numerador e uma GAUGE é selecionada para o denominador. Nessa situação, use o alinhador de taxa, ALIGN_RATE, para converter a métrica DELTA em uma métrica GAUGE. Por exemplo, consulte Políticas de alertas de proporção sobre o uso da cota de taxa para um limite.

  • Para proporções não definidas com o MQL, o tipo de recurso monitorado precisa ser o mesmo para o numerador e o denominador.

    Por exemplo, se o recurso da métrica do numerador for instâncias do Compute Engine, o recurso da métrica do denominador também precisará ser instâncias do Compute Engine.

Anomalias devido a incompatibilidades de amostragem e alinhamento

Em geral, é melhor calcular proporções com base em séries temporais coletadas para um único tipo de métrica usando valores de rótulo. Uma proporção calculada em dois tipos de métricas diferentes está sujeita a anomalias devido a períodos de amostragem e janelas de alinhamento distintos.

Por exemplo, suponha que você tem dois tipos de métrica diferentes, uma contagem total de RPC e uma contagem de erros de RPC, e quer calcular a proporção de contagem de erros de RPC em relação ao total de RPCs. As RPCs malsucedidas são contadas na série temporal dos dois tipos de métricas. Portanto, há uma chance de que, quando você alinha a série temporal, uma RPC malsucedida não apareça no mesmo intervalo de alinhamento para as duas séries temporais. Essa diferença pode ocorrer por vários motivos, incluindo:

  • Como há duas séries temporais diferentes gravando o mesmo evento, há dois valores de contador subjacentes implementando a coleta, e eles não são atualizados atomicamente.
  • As taxas de amostragem podem ser diferentes. Quando as séries temporais estão alinhadas a um período comum, as contagens de um único evento podem aparecer em intervalos de alinhamento adjacentes na série temporal de diferentes métricas.

A diferença no número de valores nos intervalos de alinhamento correspondentes pode levar a valores de proporção error/total ilógicos, como 1/0 ou 2/1.

Proporções de números maiores são menos propensas a resultar em valores sem sentido. É possível conseguir números maiores por agregação, usando uma janela de alinhamento maior que o período de amostragem ou agrupando dados para determinados rótulos. Essas técnicas minimizam o efeito de pequenas diferenças no número de pontos em um determinado intervalo. Ou seja, uma disparidade de dois pontos é mais significativa quando o número esperado de pontos em um intervalo é 3 do que quando o número esperado é 300.

Se você estiver usando tipos de métricas integrados, talvez não tenha opção senão calcular proporções nos tipos de métricas para obter o valor necessário.

Se você estiver criando métricas personalizadas para contar o mesmo resultado (como RPCs que retornam status de erro) em duas métricas diferentes, considere uma única métrica que inclua cada contagem apenas uma vez. Por exemplo, suponha que você esteja contando RPCs e queira rastrear a proporção de RPCs malsucedidas para todas as RPCs. Para resolver esse problema, crie um único tipo de métrica para contar RPCs e use um rótulo para registrar o status da invocação, incluindo o status "OK". Depois, cada valor de status, de erro ou "OK" será registrado ao atualizar um contador único para esse caso.

A seguir