Crea políticas de alertas de umbrales de métricas

En este documento, se describe cómo usar la consola de Google Cloud para crear una política de alertas basada en métricas que envíe notificaciones y genere una alerta, o equivalentemente un incidente, cuando los valores de una métrica son superiores o inferiores al umbral para un período de duración específico. Por ejemplo, una política podría activarse cuando el uso de CPU sea superior al 80% durante al menos cinco minutos.

Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en tus registros, consulta Supervisar tus registros.

En este documento, no se describe lo siguiente:

Antes de comenzar

  1. Si quieres obtener los permisos que necesitas para crear y modificar las políticas de alertas con la consola de Google Cloud, pídele a tu administrador que te otorgue el rol de IAM de Editor de Monitoring (roles/monitoring.editor) en tu proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.

    Es posible que también puedas obtener los permisos necesarios mediante funciones personalizadas, o bien otras funciones predefinidas.

    Para obtener más información sobre las funciones de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

  2. Asegúrate de estar familiarizado con los conceptos generales de las políticas de alertas. Para obtener información sobre estos temas, consulta Descripción general de las alertas.

  3. Configura los canales de notificaciones que deseas usar para recibir alertas. Para fines de redundancia, te recomendamos que crees varios tipos de canales de notificación. Para obtener más información, consulta Cómo crear y administrar canales de notificaciones.

Crear política de alertas

Para crear una política de alertas que compare el valor de esa métrica con un umbral estático, haz lo siguiente:

  1. En el panel de navegación de la consola de Google Cloud, elige Monitoring y, luego,  Alertas:

    Ir a las Alertas

  2. Selecciona Crear política.
  3. Selecciona las series temporales que deseas supervisar:

    1. Haz clic en Seleccionar una métrica, navega por los menús para seleccionar un tipo de recurso y una métrica, y haz clic en Aplicar.

      Para reducir las opciones en los menús, ingresa en la barra de filtros el nombre del tipo de métrica o de recurso que te interese. Por ejemplo, si ingresas “instancia de VM” en la barra de filtros, solo se enumeran los tipos de métricas para las instancias de VM. Si ingresas "CPU", los menús solo mostrarán los tipos de métricas que contengan "CPU" en su nombre.

      Puedes supervisar cualquier métrica integrada o cualquier métrica definida por el usuario.

      Para obtener información sobre cómo supervisar una métrica que no aparece en los menús, consulta Métrica que no aparece en el menú.

    2. Opcional: Para supervisar un subconjunto de las series temporales que coinciden con los tipos de métricas y recursos que seleccionaste en el paso anterior, haz clic en Agregar filtro. En el diálogo de filtro, selecciona la etiqueta según la cual filtrar, un comparador y, luego, el valor del filtro. Por ejemplo, el filtro zone =~ ^us.*.a$ usa una expresión regular para hacer coincidir todos los datos de series temporales cuyo nombre de zona comienza con us y termina con a. Para obtener más información, consulta Filtra las series temporales seleccionadas.

    3. Opcional: Para cambiar cómo se alinean los puntos de una serie temporal, en la sección Transformar datos, configura los campos Ventana progresiva y Función de ventana progresiva.

      Estos campos especifican cómo se combinan los puntos que se registran en una ventana. Por ejemplo, supongamos que la ventana es de 15 minutos y la función analítica es max. El punto alineado es el valor máximo de todos los puntos en los 15 minutos más recientes. Para obtener más información, consulta Alineación: regularización dentro de la serie.

      También puedes supervisar la velocidad a la que cambia el valor de una métrica mediante el campo Función de ventana progresiva cambio porcentual. Para obtener más información, consulta Cómo supervisar una tasa de cambio.

    4. Opcional: Combina series temporales cuando desees reducir la cantidad de series temporales supervisadas por una política o cuando desees supervisar solo una colección de series temporales. Por ejemplo, en lugar de supervisar el uso de CPU de cada instancia de VM, puedes calcular el promedio del uso de CPU de todas las VM de una zona y, luego, supervisar ese promedio. De forma predeterminada, las series temporales no se combinan. Para obtener información general, consulta Reducción: Combina series temporales.

      Para combinar todas las series temporales, haz lo siguiente:

      1. En la sección En todas las series temporales, haz clic en Expandir.
      2. Establece el campo Agregación de series temporales en un valor distinto de none. Por ejemplo, para mostrar el valor promedio de las series temporales, selecciona mean.
      3. Asegúrate de que el campo Agrupar por de series temporales esté vacío.

      Para combinar o agrupar series temporales por valores de etiqueta, haz lo siguiente:

      1. En la sección En todas las series temporales, haz clic en Expandir.
      2. Establece el campo Agregación de series temporales en un valor distinto de none.
      3. En el campo Agrupar por de series temporales, selecciona las etiquetas por las que deseas agrupar.

      Por ejemplo, si agrupas por la etiqueta zone y, luego, estableces el campo de agregación en un valor de mean, el gráfico mostrará una serie temporal para cada zona de la que haya datos. Las series temporales que se muestran para una zona específica son el promedio de todas las series temporales con esa zona.

    5. Haz clic en Siguiente.

  4. Configura el activador de condición:

    1. Deja el campo Tipo de condición en el valor predeterminado de Umbral.

    2. Selecciona un valor para el menú Activador de alertas. Este menú te permite especificar el subconjunto de series temporales que debe infringir el umbral antes de que se active la condición.

    3. Ingresa cuándo el valor de una métrica infringe el umbral. Para ello, usa los campos Posición del umbral y Valor del umbral. Por ejemplo, si configuras estos valores en Above threshold y 0.3, cualquier medición superior a 0.3 infringe el umbral.

    4. Opcional: Para seleccionar por cuánto tiempo las mediciones deben infringir el umbral antes de que una alerta genere un incidente, expande Opciones avanzadas y, luego, usa el menú Ventana para volver a probar.

      El valor predeterminado es No retest (No volver a probar). Con esta configuración, una sola medición puede dar como resultado una notificación. Para obtener más información y un ejemplo, consulta Configuración del período de alineación y la duración.

    5. Opcional: Para especificar cómo Monitoring evalúa la condición cuando dejan de llegar los datos, expande Opciones avanzadas y, luego, usa el menú Datos faltantes de evaluación.

      El menú Faltan datos en la evaluación se inhabilita cuando el valor de la ventana para volver a probar es No retest (No retest).

      Consola de Google Cloud
      Campo “Evaluación de datos faltantes”
      Resumen Detalles
      Datos faltantes vacíos Los incidentes abiertos permanecen abiertos.
      No se abren los incidentes nuevos.

      Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando dejan de llegar los datos. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos, el temporizador de cierre automático comienza después de un retraso de al menos 15 minutos. Si el temporizador vence, el incidente se cierra.

      En el caso de las condiciones que no se cumplen, la condición aún no se cumplirá cuando dejan de llegar los datos.

      Datos faltantes que se tratan como valores que incumplen la condición de la política Los incidentes abiertos permanecen abiertos.
      Se pueden abrir incidentes nuevos.

      Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando dejan de llegar los datos. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos durante el cierre automático más 24 horas, el incidente se cierra.

      En el caso de las condiciones que no se cumplen, este parámetro de configuración hace que la condición de umbral de métrica se comporte como una metric-absence condition. Si los datos no llegan en el tiempo especificado en el período para volver a probar, se evalúa la condición como que se cumple. En el caso de una política de alertas con una condición, la condición que se cumple hace que se abra un incidente.

      Datos faltantes que se tratan como valores que no incumplen la condición de la política Los incidentes abiertos están cerrados.
      No se abren los incidentes nuevos.

      Cuando se cumplen las condiciones, esta deja de cumplirse cuando dejan de llegar los datos. Si un incidente está abierto para esta condición, se cierra.

      En el caso de las condiciones que no se cumplen, la condición aún no se cumplirá cuando dejan de llegar los datos.

    6. Haz clic en Siguiente.

  5. Opcional: Crea una política de alertas con varias condiciones.

    La mayoría de las políticas supervisan un solo tipo de métrica, por ejemplo, una política puede supervisar la cantidad de bytes escritos en una instancia de VM. Cuando quieras supervisar varios tipos de métricas, crea una política con varias condiciones. Cada condición supervisa un tipo de métrica. Después de crear las condiciones, especifica cómo se combinan. Para obtener más información, consulta Políticas con varias condiciones.

    Para crear una política de alertas con varias condiciones, haz lo siguiente:

    1. Para cada condición adicional, haz clic en Agregar condición de alerta y, luego, configúrala.
    2. Haz clic en Siguiente y configura cómo se combinan las condiciones.
    3. Haz clic en Siguiente para avanzar a la configuración de notificaciones y documentación.
  6. Configura las notificaciones:

    1. Expande el menú Notificaciones y nombre, y selecciona tus canales de notificaciones. Para fines de redundancia, te recomendamos que agregues a una política de alertas varios tipos de canales de notificación. Para obtener más información, consulta Administra canales de notificaciones.

    2. Opcional: Para recibir notificaciones cuando se cierre un incidente, selecciona Notificar sobre cierre de incidente. De forma predeterminada, cuando creas una política de alertas con la consola de Google Cloud, solo se envía una notificación cuando se crea un incidente.

    3. Opcional: Para cambiar cuánto tiempo espera Monitoring antes de cerrar un incidente después de que los datos ya no llegan, selecciona una opción del menú Duración del cierre automático de incidentes. De forma predeterminada, cuando dejan de llegar los datos, Monitoring espera siete días antes de cerrar un incidente abierto.

    4. Selecciona una opción en el menú Nivel de gravedad de la política. Los incidentes y las notificaciones muestran el nivel de gravedad.

    5. Opcional: Para agregar etiquetas personalizadas a la política de alertas, en la sección Etiquetas de la política del usuario, haz lo siguiente:

      1. Haz clic en Agregar etiqueta y, en el campo Clave, ingresa un nombre para la etiqueta. Los nombres de las etiquetas deben comenzar con una letra minúscula y pueden contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa severity.
      2. Haz clic en Valor y, luego, ingresa un valor para tu etiqueta. Los valores de las etiquetas pueden contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa critical.

      Para obtener información sobre cómo usar las etiquetas de política a fin de administrar tus alertas, consulta Anota alertas con etiquetas.

  7. Opcional: En la sección Documentación, ingresa cualquier contenido que desees incluir en la notificación.

    Para dar formato a tu documentación, puedes usar texto sin formato, Markdown y variables. También puedes incluir vínculos para ayudar a los usuarios a depurar el incidente, como vínculos a guías internas, paneles de Google Cloud y páginas externas. Por ejemplo, en la siguiente plantilla de documentación, se describe un incidente de uso de CPU para un recurso gce_instance y, además, se incluyen varias variables a fin de hacer referencia a la política de alertas y a los recursos de REST de condición. Luego, la plantilla de documentación dirige a los lectores a páginas externas para ayudar con la depuración.

    Cuando se crean notificaciones, Monitoring reemplaza las variables de la documentación por sus valores. Los valores reemplazan las variables solo en las notificaciones. En el panel de vista previa y otros lugares de la consola de Google Cloud, solo se muestra el formato de Markdown.

    Vista previa

    ## CPU utilization exceeded
    
    ### Summary
    
    The ${metric.display_name} of the ${resource.type}
    ${resource.label.instance_id} in the project ${resource.project} has
    exceeded 90% for over 15 minutes.
    
    ### Additional resource information
    
    Condition resource name: ${condition.name}
    Alerting policy resource name: ${policy.name}
    
    ### Troubleshooting and Debug References
    
    Repository with debug scripts: example.com
    Internal troubleshooting guide: example.com
    ${resource.type} dashboard: example.com
    

    Formatear en la notificación

    Ejemplo de cómo se procesa la documentación en una notificación.

    Para obtener más información, consulta Anota alertas con la documentación definida por el usuario y Usa los controles de canales.

  8. Haz clic en Nombre de la alerta y, luego, ingresa un nombre para la política de alertas.

  9. Haz clic en Crear política.

Filtrar las series temporales seleccionadas

Puedes reducir la cantidad de datos que se supervisan si especificas criterios de filtro o aplicas una agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo que puede mejorar el rendimiento de la alerta.

Cuando proporcionas varios criterios de filtrado, solo se supervisan las series temporales que cumplen con todos los criterios.

Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, usa el campo Filtro para seleccionar el criterio que deseas filtrar. Por ejemplo, puedes filtrar por grupo de recursos, por nombre, por etiqueta de recurso, por zona y por etiqueta de métrica. Después de seleccionar el criterio del filtro, completa el filtro mediante la selección del operador de comparación y el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:

OperadorSignificadoEjemplo
= Igualdad resource.labels.zone = "us-central1-a"
!= Desigualdad resource.labels.zone != "us-central1-a"
=~ Igualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
!=~ Desigualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
starts_with El valor comienza con resource.labels.zone = starts_with("us")
ends_with El valor termina con resource.labels.zone = ends_with("b")
has_substring El valor contiene resource.labels.zone = has_substring("east")
one_of Uno de resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with El valor no comienza con resource.labels.zone != starts_with("us")
!ends_with El valor no termina con resource.labels.zone != ends_with("b")
!has_substring El valor no contiene resource.labels.zone != has_substring("east")
!one_of El valor no es uno de resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Solución de problemas

En esta sección, se incluyen sugerencias para solucionar problemas.

La métrica no aparece en el menú de métricas disponibles

Para supervisar una métrica que no aparece en el menú Selecciona una métrica, realiza una de las siguientes acciones:

  • Para crear una política de alertas que supervise una métrica de Google Cloud, expande el menú Selecciona una métrica y, luego, inhabilita el botón de activación Mostrar solo recursos y métricas activos. Cuando se inhabilita, el menú enumera todas las métricas de los servicios de Google Cloud y todas las métricas con datos.

  • Si deseas configurar una alerta para un tipo de métrica personalizada antes de que ese tipo de métrica genere datos, debes especificar el tipo de métrica mediante un filtro de Monitoring:

    1. Selecciona ? en el encabezado de la sección Seleccionar métrica y, luego, selecciona Modo de filtro directo en la información sobre la herramienta.
    2. Ingresa un filtro de supervisión o un selector de series temporales. Para obtener información sobre la sintaxis, consulta los siguientes documentos:

Supervisa una tasa de cambio

Para supervisar la tasa de cambio de un valor de métrica, configura el campo Función de ventana progresiva como cambio porcentual y, luego, Monitoring comparará la tasa de cambio de la métrica con el umbral. Cuando seleccionas la función cambio de porcentaje, Monitoring hace lo siguiente:

  1. Si la serie temporal tiene una categoría de métrica DELTA o CUMULATIVE, la serie temporal se convierte en una que tiene una categoría de métrica GAUGE. Para obtener más información sobre la conversión, consulta Tipos, tipos y conversiones.
  2. Calcula el porcentaje modificado mediante la comparación del valor promedio en el período de 10 minutos más reciente con el valor promedio del período de 10 minutos antes del período para volver a probar.

La ventana de visualización de 10 minutos es un valor fijo y no se puede cambiar. Sin embargo, sí especificas la ventana para volver a probar cuando creas una condición.

¿Qué sigue?