Acerca de las proporciones de métricas

Este documento te ayuda a elegir el mejor enfoque para graficar o supervisar una proporción de datos de métricas. También incluye enlaces a ejemplos, identifica cuándo puedes calcular razones, y describe las anomalías que podrías observar al trazar una proporción de dos métricas diferentes. Estas anomalías se deben a diferencias en la tasa de muestreo. o los parámetros de alineación.

Las proporciones te permiten transformar los datos de tus métricas en una sea más útil, el formato. Por ejemplo, considera un tipo de métrica que cuenta la cantidad de respuestas HTTP según de respuesta ante incidentes. Los datos de las métricas informan la cantidad de errores, pero no la proporción de solicitudes que fallaron. Sin embargo, los requisitos de rendimiento suelen especificarse como un porcentaje, como “La tasa de error debe ser inferior al 0.1%”. Determinar la tasa de error Con los datos de las métricas, calculas la proporción de las solicitudes que fallaron con respecto a la cantidad total de solicitudes.

Prácticas recomendadas

Para supervisar o graficar una proporción de datos de métricas, te recomendamos que utilices Lenguaje de consulta de Monitoring (MQL). Puedes usar MQL con el La API de Cloud Monitoring y la consola de Google Cloud. La consola de Google Cloud incluye un editor de código que brinda sugerencias, detección de errores y otros recursos Consultas MQL. Para obtener más información y ejemplos, consulta los siguientes documentos:

Para crear una política de alertas que supervise una proporción de métricas cuando no estén familiarizados con MQL, usen la API de Cloud Monitoring y, además, incluyan un filtro de series temporales. Para ver un ejemplo, consulta Proporción de métrica.

Para graficar una proporción de datos de métricas cuando no estás familiarizado con MQL, te recomendamos que uses la consola de Google Cloud y que uses una interfaz basada en menús. Para obtener instrucciones detalladas, consulta Crea un gráfico de la proporción de métricas y Agregar gráficos y tablas a un panel personalizado.

Restricciones con proporciones

Cuando configuras una proporción, se aplican las siguientes restricciones:

  • Después de la agregación, las etiquetas de las series temporales del denominador deben ser las iguales o un subconjunto de ellas en la serie temporal del numerador.

    Te recomendamos que selecciones opciones de agregación para que, después de agregación, el numerador y las series temporales del denominador tienen el mismo con etiquetas de recursos.

    Considera una configuración en la que la serie temporal del numerador tiene method, Etiquetas quota_metric y project_id. La hora del denominador tiene las etiquetas limit_name, quota_metric y project_id. Las opciones válidas para la agrupación de denominadores dependen de las selecciones para el numerador:

    • Numerador agrupado por la etiqueta method: Combina las series temporales del denominador en una sola. Ninguna otra agrupación genera como resultado las etiquetas para las series temporales del denominador es un subconjunto de las etiquetas de la serie temporal del numerador.
    • Numerador agrupado por la etiqueta quota_metric: Agrupa el denominador con esa etiqueta o combina todos series temporales en el denominador en una sola serie temporal.
    • Numerador agrupado por las etiquetas quota_metric y project_id: Agrupa el denominador por ambas etiquetas, por una etiqueta o combina los como serie temporal del denominador en una única serie temporal.

    Las opciones válidas de agregación de denominador siempre eliminan el limit_name etiqueta de la serie temporal agrupada porque no esté presente en la serie temporal del numerador.

    Para ver ejemplos, consulta Ejemplos de política de alertas de MQL.

  • El período de alineación debe ser el mismo para el numerador y el denominador cuando configuras un gráfico con la consola de Google Cloud Sin embargo, estos campos pueden ser diferentes cuando se usa la API de Cloud Monitoring.

    Te recomendamos que uses el mismo período de alineación para el numerador en el denominador independientemente de la herramienta que uses para crear el gráfico.

  • El numerador y el denominador deben tener el mismo tipo de valor. Por ejemplo, cuando el numerador es del tipo DOUBLE, el denominador también debe ser del tipo DOUBLE.

    Las proporciones requieren que la métrica de numerador y denominador tengan un valor tipo de DOUBLE o INT64.

  • Las series temporales alineadas para el numerador y el denominador deben tener mismo tipo de métrica. Cuando las dos métricas tienen tipos diferentes, debes usar alineadores para convertirlos al mismo tipo.

    Considera una configuración en la que se selecciona una métrica DELTA para la numerador y una métrica GAUGE para el denominador. En este caso, usa el alineador de tarifas ALIGN_RATE. para convertir la métrica DELTA en una métrica GAUGE. Para ver un ejemplo, consulta Proporcióna las políticas de alertas sobre el uso de la cuota de frecuencia para un límite.

  • Para las proporciones que no se definen con MQL, el tipo de recurso supervisado debe ser la misma para el numerador y el denominador.

    Por ejemplo, si el recurso para la métrica del numerador son las instancias de Compute Engine; el recurso de la métrica de denominador también deben ser instancias de Compute Engine.

Anomalías debido a discrepancias en el muestreo y la alineación

En general, es mejor calcular las proporciones según las series temporales recopiladas para un solo tipo de métrica mediante el uso de valores de etiquetas. Una proporción calculada sobre dos los diferentes tipos de métricas están sujetos a anomalías debido a diversos los puntos y las ventanas de alineación.

Por ejemplo, supongamos que tienes dos tipos de métricas, un recuento total de RPC y un recuento de errores de RPC, y deseas calcular la proporción de las RPC del recuento de errores sobre el total de RPC. Las RPC con errores se cuentan en la serie temporal de en ambos tipos de métricas. Por lo tanto, existe la posibilidad de que, cuando alinees el tiempo, serie, una RPC fallida no aparece en el mismo intervalo de alineación para en ambas series temporales. Esta diferencia puede ocurrir por varias razones, incluidas las siguientes:

  • Debido a que hay dos series temporales diferentes que graban el mismo evento, no hay dos valores de contador subyacentes que implementan la colección, no se actualizan de forma atómica.
  • Las tasas de muestreo pueden variar. Cuando las series temporales se alinean con una política de entrada, los recuentos de un solo evento pueden aparecer en la alineación adyacente en las series temporales para las diferentes métricas.

La diferencia en la cantidad de valores en los intervalos de alineación correspondientes puede generar valores de proporción error/total sin sentido, como 1/0 o 2/1.

Las proporciones de números más grandes tienen menos probabilidades de generar valores sin sentido. Puedes obtener números más grandes mediante la agregación, ya sea con una ventana de alineación es decir, más largo que el período de muestreo o agrupando los datos de ciertos con etiquetas de recursos. Estas técnicas minimizan el efecto de las pequeñas diferencias en el la cantidad de puntos en un intervalo determinado. Es decir, una disparidad de dos puntos es más significativo cuando la cantidad esperada de puntos en un intervalo es 3 que cuando el número esperado es 300.

Si usas tipos de métricas integradas, es posible que no tengas más opción que calcular las proporciones entre los tipos de métricas para obtener el valor que necesitas.

Si diseñas métricas personalizadas que pueden contar lo mismo, como las RPC que muestran el estado del error, en dos métricas diferentes, considera una sola métrica, que incluye cada recuento solo una vez. Por ejemplo, supongamos que estás contando las RPC y quieres hacer un seguimiento de la proporción a todos los RPC. Para resolver este problema, crear un solo tipo de métrica para contar RPC y usar una etiqueta para registrar estado de la invocación, incluido "OK" estado. Luego, cada valor de estado, “OK” o “error” se registra actualizando un solo contador para ese caso.

¿Qué sigue?