Acerca de las proporciones de las métricas

En este documento, encontrarás ayuda para elegir el mejor enfoque para crear gráficos o supervisar una proporción de datos de métricas. También incluye vínculos a ejemplos, identifica cuándo puedes calcular las proporciones y describe las anomalías que puedes ver cuando se representa una proporción de dos métricas diferentes. Estas anomalías se deben a diferencias en la tasa de muestreo o los parámetros de alineación.

Las proporciones te permiten transformar los datos de tus métricas en un formato diferente y potencialmente más útil. Por ejemplo, considera un tipo de métrica que cuente la cantidad de respuestas HTTP por código de respuesta. Los datos de las métricas informan la cantidad de errores, pero no la proporción de solicitudes que fallaron. Sin embargo, los requisitos de rendimiento a menudo se especifican como un porcentaje, como “La tasa de error debe ser inferior al 0.1%”. Para determinar la tasa de errores con los datos de la métrica, calcula la proporción de solicitudes que fallaron con respecto a la cantidad total de solicitudes.

prácticas recomendadas

Para supervisar o representar en gráficos una proporción de datos de métricas, te recomendamos que uses el Lenguaje de consulta de Monitoring (MQL). Puedes usar MQL con la API de Cloud Monitoring y la consola de Google Cloud. La consola de Google Cloud incluye un editor de código que proporciona sugerencias, detección de errores y otro tipo de asistencia para crear consultas válidas de MQL. Para obtener más información y ejemplos, consulta los siguientes documentos:

Para crear una política de alertas que supervise una proporción de métricas cuando no estés familiarizado con MQL, usa la API de Cloud Monitoring y, además, incluye un filtro de series temporales. Para ver un ejemplo, consulta Proporción de métrica.

Para graficar una proporción de datos de métricas cuando no estás familiarizado con MQL, te recomendamos que uses la consola de Google Cloud y una interfaz basada en menús. Para obtener instrucciones detalladas, consulta Crea un gráfico de la proporción de métricas y Agrega gráficos y tablas a un panel personalizado.

Restricciones con razones

Cuando configuras una proporción, se aplican las siguientes restricciones:

  • Después de la agregación, las etiquetas de la serie temporal del denominador deben ser las mismas que las etiquetas de la serie temporal del numerador, o un subconjunto de ellas.

    Te recomendamos que selecciones opciones de agregación para que, después de la agregación, las series temporales del numerador y del denominador tengan las mismas etiquetas.

    Considera una configuración en la que la serie temporal del numerador tiene etiquetas method, quota_metric y project_id. La serie temporal del denominador tiene las etiquetas limit_name, quota_metric y project_id. Las opciones válidas para la agrupación de denominadores dependen de las selecciones válidas para el numerador:

    • Numerador agrupado por la etiqueta method: Combina las series temporales del denominador en una sola serie temporal. Ninguna otra agrupación hace que las etiquetas de las series temporales del denominador sean un subconjunto de las etiquetas de las series temporales del numerador.
    • Numerador agrupado por la etiqueta quota_metric: Agrupa el denominador por esa etiqueta o combina todas las series temporales del denominador en una sola serie temporal.
    • Numerador agrupado por las etiquetas quota_metric y project_id: Agrupa el denominador por ambas etiquetas, por una etiqueta, o combina la serie temporal del denominador en una sola serie temporal.

    Las opciones válidas de agregación de denominadores siempre eliminan la etiqueta limit_name de las series temporales agrupadas, ya que esa etiqueta no está presente en las series temporales del numerador.

    Para ver ejemplos, consulta Ejemplos de política de alertas de MQL.

  • El período de alineación debe ser el mismo para el numerador y el denominador cuando se configura un gráfico con la consola de Google Cloud. Sin embargo, estos campos pueden ser diferentes cuando se usa la API de Cloud Monitoring.

    Te recomendamos que uses el mismo período de alineación para el numerador y el denominador, sin importar la herramienta que uses para crear el gráfico.

  • El numerador y el denominador deben tener el mismo tipo de valor. Por ejemplo, cuando el numerador es del tipo DOUBLE, el denominador también debe ser del tipo DOUBLE.

    Las proporciones requieren que las métricas de numerador y denominador tengan un tipo de valor de DOUBLE o INT64.

  • Las series temporales alineadas para el numerador y el denominador deben tener el mismo tipo de métrica. Cuando las dos métricas tienen tipos diferentes, debes usar alineadores para convertirlos al mismo tipo.

    Considera una configuración en la que se selecciona una métrica DELTA para el numerador y una métrica GAUGE para el denominador. En este caso, usa el alineador de tarifas, ALIGN_RATE, para convertir la métrica DELTA en una métrica GAUGE. Si deseas ver un ejemplo, consulta Políticas de alertas de proporción sobre el uso de la cuota de frecuencia para un límite.

  • Para las proporciones que no se definen con MQL, el tipo de recurso supervisado debe ser el mismo para el numerador y el denominador.

    Por ejemplo, si el recurso para la métrica de numerador son instancias de Compute Engine, el recurso de la métrica de denominador también debe ser instancias de Compute Engine.

Anomalías debido a discrepancias en el muestreo y la alineación

En general, es mejor calcular las proporciones según las series temporales recopiladas para un solo tipo de métrica mediante el uso de valores de etiquetas. Una proporción calculada sobre dos tipos de métricas diferentes está sujeta a anomalías debido a diferentes períodos de muestreo y ventanas de alineación.

Por ejemplo, supongamos que tienes dos tipos de métricas, un recuento total de RPC y un recuento de errores de RPC, y deseas calcular la proporción de las RPC del recuento de errores sobre el total de RPC. Las RPC con errores se cuentan en las series temporales de ambos tipos de métricas. Por lo tanto, existe la posibilidad de que, cuando alinees las series temporales, una RPC con errores no aparezca en el mismo intervalo de alineación para ambas series temporales. Esta diferencia puede ocurrir por varias razones, incluidas las siguientes:

  • Debido a que hay dos series temporales diferentes que registran el mismo evento, hay dos valores de contador subyacentes que implementan la colección y no se actualizan de forma atómica.
  • Las tasas de muestreo pueden variar. Cuando las series temporales se alinean con un período común, los recuentos de un solo evento pueden aparecer en intervalos de alineación adyacentes en las series temporales para las diferentes métricas.

La diferencia en la cantidad de valores en los intervalos de alineación correspondientes puede generar valores de proporción error/total sin sentido, como 1/0 o 2/1.

Es menos probable que las proporciones de números más grandes den como resultado valores sin sentido. Puedes obtener números más grandes mediante la agregación, ya sea con una ventana de alineación más larga que el período de muestreo o mediante la agrupación de datos para ciertas etiquetas. Estas técnicas minimizan el efecto de pequeñas diferencias en la cantidad de puntos en un intervalo determinado. Es decir, una disparidad de dos puntos es más significativa cuando la cantidad esperada de puntos en un intervalo es 3 que cuando el número esperado es 300.

Si usas tipos de métricas integradas, es posible que no tengas más opción que calcular las proporciones entre los tipos de métricas para obtener el valor que necesitas.

Si diseñas métricas personalizadas que pueden contar lo mismo, como las RPC que muestran el estado del error, en dos métricas diferentes, considera una sola métrica, que incluye cada recuento solo una vez. Por ejemplo, supongamos que estás contando RPC y deseas realizar un seguimiento de la proporción de RPC con errores a todas las RPC. Para resolver este problema, crea un solo tipo de métrica para contar las RPC y usa una etiqueta a fin de registrar el estado de la invocación, incluido el estado “OK”. Luego, cada valor de estado (error o "OK") se registra mediante la actualización de un solo contador para ese caso.

¿Qué sigue?