Selección y configuración de métricas

En este documento, se describen los campos que estableces cuando configuras la condición de una política de alertas. Por lo general, creas una política de alertas si deseas recibir notificaciones cuando los datos de series temporales, como el uso de CPU de una máquina virtual, cumplen ciertas condiciones. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en tus registros, consulta Supervisar tus registros.

En este documento, se usa la terminología que se usa en la interfaz controlada por menú de Google Cloud Console. Sin embargo, la información conceptual se aplica a todos los enfoques que puedes usar para crear una política de alertas. Para obtener información sobre el uso de la API de Cloud Monitoring, consulta Políticas de alertas en la API de Cloud Monitoring.

Selecciona los datos que se mostrarán

Para especificar las métricas que se mostrarán cuando se cree una política de alertas, debes especificar valores para una métrica y un tipo de recurso:

Para configurar una condición en una política de alertas, puedes usar la API de Cloud Monitoring o Google Cloud Console. El diálogo predeterminado que usas para crear una política de alertas cuando usas Google Cloud Console se controla mediante un menú. Sin embargo, si prefieres usar el lenguaje de consulta de Monitoring (MQL), puedes configurar Google Cloud Console para activar un editor de MQL.

No todas las series temporales se pueden representar con una métrica y un modelo de recursos. Por ejemplo, no puedes especificar una métrica y un recurso cuando desees supervisar la cantidad de procesos que se ejecutan en una máquina virtual (VM). En situaciones como estas, configura Google Cloud Console para que abra el modo de filtro directo.

Modo predeterminado

Usa el modo predeterminado cuando quieras configurar una condición que supervise un tipo de métrica para un tipo de recurso específico y no quieras usar el lenguaje de consulta de Monitoring (MQL). De forma predeterminada, los menús solo enumeran métricas sobre las cuales se recibieron datos. Se proporciona una opción para activar o desactivar la lista que te permite enumerar todas las métricas de Google Cloud.

  • El campo métricas identifica las medidas que se recopilarán de un recurso supervisado. En este, se incluye una descripción de lo que se mide y cómo se interpretan las mediciones. Métrica es una forma corta de tipo de métrica. Para obtener información conceptual, consulta Tipos de métricas.

  • En el campo Tipo de recurso, se especifica desde qué recurso se capturan los datos de la métrica. A veces, el tipo de recurso se denomina tipo de recurso supervisado o recurso. Para obtener información conceptual, consulta Recursos supervisados.

Para usar el modo predeterminado, haz lo siguiente:

  1. En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
    Ir a Monitoring
  2. En el panel de navegación, selecciona Alertas.
  3. Haga clic en Crear política.
  4. Selecciona un recurso y una métrica con el menú Seleccionar una métrica.
  5. Agrega filtros, especifica la transformación de datos y completa el diálogo de la política de alertas. Para obtener más información, consulta Crea una política de alertas basada en métricas.

Modo MQL

Si quieres usar el lenguaje de consulta de Monitoring (MQL) para describir la condición o supervisar una proporción de métricas, usa [MQL].

Para usar MQL, haz lo siguiente:

  1. En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
    Ir a Monitoring
  2. En el panel de navegación, selecciona Alertas.
  3. Haga clic en Crear política.
  4. En la barra de herramientas, selecciona MQL.
  5. Ingresa una expresión de MQL. Si deseas obtener información para usar MQL, consulta Usa el lenguaje de consulta de Monitoring.
  6. Completa el diálogo de la política de alertas. Para obtener más información, consulta Administra las políticas de alertas con MQL.

Modo de filtro directo

Si desea realizar alguna de las siguientes acciones, use el Modo de filtro directo:

  • Supervisa los objetivos de nivel de servicio (SLO).
  • Configura una alerta para métricas personalizadas sobre las que aún no tienes datos.
  • Supervisar el recuento de procesos que se ejecutan en las VM
  • Verifica la sintaxis de una instrucción de filtro que se incluirá en un comando de API.

Cuando usas el modo de filtro directo, para seleccionar la serie temporal, ingresa un filtro de Monitoring. Por ejemplo, el siguiente filtro de Monitoring en el gráfico muestra un recuento de procesos cuyo nombre incluye nginx:

select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
resource.type="gce_instance"

En el siguiente filtro, se selecciona la serie temporal Disk write bytes para las VM de Compute Engine que se encuentran en la zona us-central1-a:

metric.type="compute.googleapis.com/instance/disk/write_bytes_count"
resource.type="gce_instance"
resource.label."zone"="us-central1-a"

Para ingresar un filtro de supervisión o un selector de series temporales, haz lo siguiente:

  1. En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
    Ir a Monitoring
  2. En el panel de navegación, selecciona Alertas.
  3. Haga clic en Crear política.
  4. Seleccione ? en el encabezado de la sección Seleccionar métrica y, luego, selecciona Modo de filtro directo en la información sobre la herramienta.
  5. Ingresa un filtro de supervisión o un selector de series temporales. Para obtener información sobre la sintaxis, consulta los siguientes documentos:

  6. Especifica la transformación de datos y completa el diálogo de la política de alertas. Para obtener más información, consulta Crea una política de alertas del estado del proceso.

Filtra los datos seleccionados

Para reducir la cantidad de datos que se supervisan, especifica los criterios del filtro o aplica la agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo que puede mejorar el rendimiento de la alerta.

Cuando proporcionas varios criterios de filtrado, el gráfico correspondiente muestra solo las series temporales que cumplen con todos los criterios, un AND lógico.

Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, usa el campo Filtro para seleccionar el criterio que deseas filtrar. Por ejemplo, puedes filtrar por grupo de recursos, por nombre, por etiqueta de recurso, por zona y por etiqueta de métrica. Después de seleccionar el criterio del filtro, completa el filtro mediante la selección del operador de comparación y el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:

OperadorSignificadoEjemplo
= Igualdad resource.labels.zone = "us-central1-a
!= Desigualdad resource.labels.zone != "us-central1-a"
=~ Igualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
!=~ Desigualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
starts_with El valor comienza con resource.labels.zone = starts_with("us")
ends_with El valor termina con resource.labels.zone = ends_with("b")
has_substring El valor contiene resource.labels.zone = has_substring("east")
one_of Uno de resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with El valor no comienza con resource.labels.zone != starts_with("us")
!ends_with El valor no termina con resource.labels.zone != ends_with("b")
!has_substring El valor no contiene resource.labels.zone != has_substring("east")
!one_of El valor no es uno de resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Transforma los datos

Después de seleccionar las series temporales, los siguientes pasos son especificar cómo se procesa cada una, también conocida como alineación, y cómo se combinan las series temporales alineadas.

En el resto de esta página, se describen brevemente estas opciones. Para obtener una explicación detallada, consulta Manipulación de series temporales.

Alinea series temporales

La alineación es el proceso de convertir los datos de la serie temporal recibidos por Monitoring en una nueva serie temporal con datos extraídos por un período fijo. El proceso de alineación está compuesto por los siguientes pasos:

  1. La división de una serie temporal en un conjunto de intervalos de longitud fija.
  2. La recopilación de todos los datos recibidos en cada intervalo y el aplicado de una función para combinar esos datos Por ejemplo, puedes seleccionar esta función para calcular el promedio de todas las muestras.
  3. Asocia una marca de tiempo con el valor calculado en el paso anterior y, luego, agrega el par a las series temporales alineadas.

Para obtener un análisis general de alineación, consulta Alineación: regularización dentro de la serie.

Cuando creas una condición en una política de alertas, debes especificar los parámetros de alineación. Si usas Google Cloud Console, se proporcionan los valores predeterminados para estos parámetros:

  • Ventana progresiva: este campo es un intervalo retrospectivo de un punto en el tiempo específico. Por ejemplo, si el valor es de cinco minutos, a la 1:00 p.m., las muestras recibidas entre las 12:55 p.m. y la 1:00 p.m. están alineadas. A la 1:01 p.m., las muestras recibidas entre las 12:56 p.m. y la 1:01 p.m. están alineadas. En el contexto de las políticas de alertas, el período de alineación se puede ver como una ventana deslizante que observa el pasado. Para ver un análisis más completo sobre este campo, consulta El período de alineación y la duración.

  • Función de ventana progresiva: El campo especifica la función que se usa para combinar todos los datos en el intervalo de retrospectiva. En la API de Cloud Monitoring, este campo se llama alinear. Para obtener más información sobre las funciones disponibles, consulta Aligner en la referencia de la API. Algunas de las funciones de alineación alinean los datos y los convierten de una categoría o tipo de métrica a otro. Para obtener una explicación detallada, consulta Clases, tipos y conversiones.

Combina series temporales

Puedes reducir la cantidad de datos que se muestran de una métrica si combinas diferentes series temporales. Para combinar varias series temporales, por lo general, debes especificar una agrupación y una función. La agrupación se realiza mediante valores de etiqueta. La función define cómo se combinan todos los datos de series temporales de un grupo en una nueva serie temporal.

Para acceder a las opciones de combinación de series temporales, haz clic en Mostrar más en la sección Serie temporal.

Para combinar series temporales por valor de etiqueta, haz clic en el texto Grupo de series temporales por y selecciona el menú. El menú se construye de forma dinámica según la serie temporal que seleccionaste.

Cuando agregas la primera etiqueta, ocurre lo siguiente:

  • Se muestra un error porque el campo Agregación de serie temporal está configurado como ninguno. Para resolver el error, selecciona una función que se use para combinar las series temporales con el mismo valor de etiqueta.

  • El gráfico muestra una serie temporal para cada valor de la etiqueta que aparece en el campo Grupo de series temporales por.

Si no especificas una opción de agrupación y especificas una función de agregación, esa función se aplica a la serie temporal seleccionada y genera una sola serie temporal.

Puedes agrupar por varias etiquetas. Cuando tienes varias opciones de agrupación, el agregador se aplica al conjunto de series temporales que tienen los mismos valores para las etiquetas seleccionadas.

En el gráfico resultante, se muestra una serie temporal para cada combinación de valores de etiqueta. No importa el orden en que especifiques las etiquetas.

Por ejemplo, en la siguiente captura de pantalla, se muestra la agrupación por user_labels.version y por system_labels.machine_image:

Se muestran las series temporales agrupadas por imagen de máquina y versión

Como se ilustra, si agrupas mediante ambas etiquetas, obtienes una serie temporal para cada par de valores. El hecho de que obtengas una serie temporal por cada combinación de etiquetas significa que esta técnica puede crear fácilmente más datos de los que puedes utilizar en un solo gráfico.

Cuando especificas la agrupación o si seleccionas un agregador, la serie temporal representada solo contiene las etiquetas obligatorias, como el identificador del proyecto, y las etiquetas que especifica la agrupación.

Para quitar un grupo por condición, debes hacer lo siguiente:

  1. Quita las etiquetas agrupadas.
  2. Configura el agregador como none.

Agregación secundaria

Si se muestran varias series temporales después de la Transformación de datos principal y si deseas que la política de alertas supervise una sola serie temporal, usa los campos Transformación de datos secundarios.

Comportamiento cuando faltan datos

consola de Google Cloud

Puedes configurar cómo Monitoring evalúa una condición de umbral de métrica cuando los datos dejan de llegar. Por ejemplo, cuando está abierto un incidente y no llega una medición esperada, ¿quieres que Monitoring deje el incidente abierto o lo cierre de inmediato? Del mismo modo, cuando los datos dejan de llegar y no hay ningún incidente abierto, ¿quieres que se abra un incidente? Por último, ¿cuánto tiempo debe permanecer abierto un incidente después de que dejan de llegar los datos?

Existen dos campos configurables en los que se especifica la forma en que Monitoring evalúa las condiciones del umbral de las métricas cuando dejan de llegar los datos:

  • Para configurar cómo Monitoring determina el valor de reemplazo para datos faltantes, usa el campo Datos faltantes de evaluación que estableciste en el paso Activador de condición. Este campo se inhabilita cuando laventana de prueba está configurada en Sin reprueba.

  • Para configurar cuánto tiempo espera Monitoring antes de cerrar un incidente abierto después de que dejan de llegar los datos, usa el campo Duración del cierre automático de incidentes. Puedes establecer la duración del cierre automático en el paso Notificación. La duración predeterminada de cierre automático es de siete días.

A continuación, se describen las diferentes opciones para el campo de datos faltantes:

Google Cloud Console
Campo de datos faltantes de la evaluación
Resumen Detalles
Datos faltantes vacíos Los incidentes abiertos permanecen abiertos.
No se abren incidentes nuevos.

Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando hay un incidente abierto y no llegan datos, el temporizador de cierre automático comienza después de un retraso de al menos 15 minutos. Si el temporizador expira, el incidente se cierra.

En el caso de que las condiciones no se cumplan, no se cumplirá cuando los datos dejen de llegar.

Datos faltantes que se tratan como valores que infringen la condición de la política Los incidentes abiertos permanecen abiertos.
Se pueden abrir incidentes nuevos.

Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos que duran el cierre automático más 24 horas, se cierra.

En el caso de las condiciones que no se cumplen, esta configuración hace que la condición de umbral de métrica se comporte como metric-absence condition. Si los datos no llegan en el tiempo especificado en el período que se vuelve a probar, la condición se evalúa como cumplida. Para una política de alertas con una condición, la condición que se cumple genera un incidente.

Datos faltantes que se tratan como valores que no infringen la condición de la política Se cerraron los incidentes abiertos.
No se abren incidentes nuevos.

En las condiciones que se cumplen, la condición deja de cumplirse cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, entonces el incidente se cierra.

En el caso de que las condiciones no se cumplan, no se cumplirá cuando los datos dejen de llegar.

API

Puedes configurar cómo Monitoring evalúa una condición de umbral de métrica cuando los datos dejan de llegar. Por ejemplo, cuando está abierto un incidente y no llega una medición esperada, ¿quieres que Monitoring deje el incidente abierto o lo cierre de inmediato? Del mismo modo, cuando los datos dejan de llegar y no hay ningún incidente abierto, ¿quieres que se abra un incidente? Por último, ¿cuánto tiempo debe permanecer abierto un incidente después de que dejan de llegar los datos?

Existen dos campos configurables en los que se especifica la forma en que Monitoring evalúa las condiciones del umbral de las métricas cuando dejan de llegar los datos:

  • Para configurar la forma en que Monitoring determina el valor de reemplazo para datos faltantes, usa el campo evaluationMissingData de la estructura MetricThreshold. Este campo se ignora cuando el campo duration es cero.

  • Para configurar cuánto tiempo espera Monitoring antes de cerrar un incidente abierto después de que dejan de llegar los datos, usa el campo autoClose en la estructura AlertStrategy.

A continuación, se describen las diferentes opciones para el campo de datos faltantes:

API
Campo evaluationMissingData
Resumen Detalles
EVALUATION_MISSING_DATA_UNSPECIFIED Los incidentes abiertos permanecen abiertos.
No se abren incidentes nuevos.

Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando hay un incidente abierto y no llegan datos, el temporizador de cierre automático comienza después de un retraso de al menos 15 minutos. Si el temporizador expira, el incidente se cierra.

En el caso de que las condiciones no se cumplan, no se cumplirá cuando los datos dejen de llegar.

EVALUATION_MISSING_DATA_ACTIVE Los incidentes abiertos permanecen abiertos.
Se pueden abrir incidentes nuevos.

Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos para la duración del cierre automático más 24 horas, se cierra.

En el caso de las condiciones que no se cumplen, esta configuración hace que la condición de umbral de métrica se comporte como metric-absence condition. Si los datos no llegan en el tiempo especificado en el campo “duration”, la condición se evalúa como cumplida. Para una política de alertas con una condición, la condición que se cumple genera un incidente.

EVALUATION_MISSING_DATA_INACTIVE Se cerraron los incidentes abiertos.
No se abren incidentes nuevos.

En las condiciones que se cumplen, la condición deja de cumplirse cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, entonces el incidente se cierra.

En el caso de que las condiciones no se cumplan, no se cumplirá cuando los datos dejen de llegar.