Ayúdanos a definir el futuro de las operaciones de software y hazte escuchar con comentarios mediante la encuesta sobre el estado de DevOps de 2023.

Crea políticas de alertas de umbral de métrica

En este documento, se describe cómo usar Google Cloud Console para crear una política de alertas basada en métricas que envíe notificaciones y genere una alerta, o un incidente, cuando los valores de una métrica son superiores o inferiores al umbral de una ventana de duración específica. Por ejemplo, una política podría activarse cuando el uso de CPU sea superior al 80% durante al menos cinco minutos.

Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en tus registros, consulta Supervisar tus registros.

En este documento, no se describe lo siguiente:

Antes de comenzar

  1. Para obtener los permisos que necesitas para crear y modificar políticas de alertas mediante la consola de Google Cloud, pídele al administrador que te otorgue el rol de IAM Editor de Monitoring (roles/monitoring.editor). Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

    Para obtener más información sobre las funciones de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

  2. Asegúrese de estar familiarizado con los conceptos generales de las políticas de alertas. Para obtener información sobre estos temas, consulta Descripción general de las alertas.

  3. Configura los canales de notificaciones que deseas usar para recibir alertas. Por motivos de redundancia, te recomendamos crear varios tipos de canales de notificaciones. Para obtener más información, consulta Cómo crear y administrar canales de notificaciones.

Crear política de alertas

Para crear una política de alertas que compare el valor de esa métrica con un umbral estático, haz lo siguiente:

  1. En la consola de Google Cloud, selecciona Monitoring o haz clic en el siguiente botón:
    Ir a Monitoring

  2. En el panel de navegación, selecciona Alertas y, luego, haz clic en Crear política.

  3. Selecciona la serie temporal que se supervisará:

    1. Haz clic en Seleccionar una métrica, navega por los menús para seleccionar un tipo de recurso y una métrica y, luego, haz clic en Aplicar.

      Para reducir las opciones en los menús, ingresa en la barra de filtros el nombre del tipo de métrica o tipo de recurso que te interesa. Por ejemplo, si ingresas “VM instance” (Instancia de VM) en la barra de filtros, solo se mostrarán los tipos de métricas para las instancias de VM (VM). Si ingresas "CPU", los menús solo mostrarán tipos de métricas que contienen "CPU" en su nombre.

      Puedes supervisar cualquier métrica integrada o cualquier métrica definida por el usuario.

      Para obtener información sobre cómo supervisar una métrica que no aparece en los menús, consulta La métrica no aparece en el menú.

    2. Opcional: Para supervisar un subconjunto de las series temporales que coinciden con los tipos de métricas y recursos que seleccionaste en el paso anterior, haz clic en Agregar filtro. En el diálogo de filtros, selecciona la etiqueta por la que deseas filtrar, un comparador y, luego, el valor del filtro. Por ejemplo, el filtro zone =~ ^us.*.a$ usa una expresión regular para hacer coincidir todos los datos de series temporales cuyo nombre de zona comienza con us y termina con a. Para obtener más información, consulta Filtra las series temporales seleccionadas.

    3. Opcional: Para cambiar cómo se alinean los puntos en una serie temporal, en la sección Datos de transformación, configura los campos Ventana progresiva y Función de ventana progresiva.

      Estos campos especifican cómo se combinan los puntos que se registran en una ventana. Por ejemplo, supongamos que la ventana es de 15 minutos y la función analítica es max. El punto alineado es el valor máximo de todos los puntos en los 15 minutos más recientes. Para obtener más información, consulta Alineación: regularización dentro de la serie.

      También puedes supervisar la velocidad a la que cambia el valor de una métrica con el campo Función de ventana progresiva para cambiar el porcentaje. Para obtener más información, consulta Cómo supervisar una tasa de cambio.

    4. Opcional: Combina series temporales cuando quieras reducir la cantidad de series temporales que supervisa una política o cuando quieras supervisar solo una colección de series temporales. Por ejemplo, en lugar de supervisar el uso de CPU de cada instancia de VM, es posible que desees calcular el promedio del uso de CPU para todas las VM en una zona y, luego, supervisar ese promedio. De forma predeterminada, las series temporales no están combinadas. Para obtener información general, consulta Reducción: combinación de series temporales.

      Para combinar todas las series temporales, haz lo siguiente:

      1. En la sección Across time series, haz clic en Expand.
      2. Establece el campo Agregación de serie temporal en un valor distinto de none. Por ejemplo, para mostrar el valor promedio de las series temporales, selecciona mean.
      3. Asegúrate de que el campo Grupo de series temporales por esté vacío.

      Para combinar o agrupar series temporales por valores de etiqueta, haz lo siguiente:

      1. En la sección Across time series, haz clic en Expand.
      2. Establece el campo Agregación de serie temporal en un valor distinto de none.
      3. En el campo Grupo de series temporales por, selecciona las etiquetas por las que quieres agrupar.

      Por ejemplo, si agrupas por la etiqueta zone y, luego, configuras el campo de agregación en un valor de mean, el gráfico mostrará una serie temporal para cada zona de la que hay datos. La serie temporal que se muestra para una zona específica es el promedio de todas las series temporales que tiene esa zona.

    5. Haz clic en Siguiente.

  4. Configura el activador de la condición:

    1. Deja el campo Condition type con el valor predeterminado de Threshold.

    2. Selecciona un valor para el menú Activador de alerta. Este menú te permite especificar el subconjunto de series temporales que deben infringir el umbral antes de que se active la condición.

    3. Ingresa cuándo el valor de una métrica infringe el umbral mediante los campos Posición del umbral y Valor del umbral. Por ejemplo, si estableces estos valores en Por encima del umbral y 0.3, cualquier medición superior a 0.3 infringe el umbral.

    4. Opcional: Para seleccionar por cuánto tiempo las mediciones deben infringir el umbral antes de que se generen las alertas, expande Opciones avanzadas y, luego, usa el menú Volver a probar.

      El valor predeterminado es Sin volver a probar. Con esta configuración, una sola medición puede generar una notificación. Para obtener más información y un ejemplo, consulta Configuración del período de alineación y la duración.

    5. Opcional: Para especificar cómo Monitoring evalúa la condición cuando dejan de llegar los datos, expande Opciones avanzadas y, luego, usa el menú Datos faltantes de evaluación.

      El menú Datos faltantes de evaluación se inhabilita cuando el valor de la ventana Volver a probar es No volver a probar.

      Consola de Google Cloud
      Campo "Evaluación de datos faltantes"
      Resumen Detalles
      Faltan datos Los incidentes abiertos permanecen abiertos.
      No se abren nuevos incidentes.

      Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente permanece abierto. Cuando hay un incidente abierto y no llegan datos, el temporizador para el cierre automático comienza después de un retraso de al menos 15 minutos. Si el temporizador vence, el incidente se cierra.

      En el caso de que las condiciones no se cumplan, no se cumple la condición cuando dejan de llegar los datos.

      Faltan datos tratados como valores que infringen la condición de la política Los incidentes abiertos permanecen abiertos.
      Se pueden abrir incidentes nuevos.

      Para las condiciones que se cumplen, la condición se sigue cumpliendo cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos para el período de cierre automático más 24 horas, el incidente se cierra.

      En el caso de las condiciones que no se cumplen, este parámetro de configuración hace que la condición del umbral de métrica se comporte como un metric-absence condition. Si los datos no llegan en el tiempo que especifica el período de nueva prueba, la condición se evalúa como cumplida. Para una política de alertas con una condición, la condición que se cumple genera un incidente que se abre.

      Faltan datos que se tratan como valores que no infringen la condición de la política Los incidentes abiertos están cerrados.
      No se abren nuevos incidentes.

      Para las condiciones que se cumplen, la condición deja de cumplirse cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, entonces el incidente se cierra.

      En el caso de que las condiciones no se cumplan, no se cumple la condición cuando dejan de llegar los datos.

    6. Haz clic en Siguiente.

  5. Opcional: Crea una política de alertas con varias condiciones.

    La mayoría de las políticas supervisan un solo tipo de métrica; por ejemplo, una política puede supervisar la cantidad de bytes escritos en una instancia de VM. Cuando desees supervisar varios tipos de métricas, crea una política con varias condiciones. Cada condición supervisa un tipo de métrica. Después de crear las condiciones, debes especificar cómo se combinan. Para obtener más información, consulta Políticas con varias condiciones.

    Para crear una política de alertas con varias condiciones, haz lo siguiente:

    1. Para cada condición adicional, haz clic en Agregar condición de alerta y, luego, configura esa condición.
    2. Haga clic en Siguiente y configure cómo se combinan las condiciones.
    3. Haz clic en Siguiente para avanzar a la configuración de notificaciones y documentación.
  6. Configura las notificaciones y la documentación:

    1. Expande el menú Canales de notificaciones y selecciona tus canales de notificaciones. Para agregar redundancia, recomendamos que agregues a una política de alertas varios tipos de canales de notificación. Para obtener más información, consulta Administra canales de notificaciones.

    2. Opcional: Para recibir una notificación cuando se cierre un incidente, selecciona Notificar cuando se cierre el incidente. De forma predeterminada, cuando creas una política de alertas con la consola de Google Cloud, solo se envía una notificación cuando se crea un incidente.

    3. Opcional: Para cambiar el tiempo de supervisión antes de cerrar un incidente después de que dejen de llegar datos, selecciona una opción en el menú Duración del cierre automático de incidentes. De forma predeterminada, cuando los datos dejan de llegar, Monitoring espera siete días antes de cerrar un incidente abierto.

    4. Opcional: Para agregar etiquetas personalizadas a la política de alertas, haz lo siguiente en la sección Etiquetas de usuario de las políticas:

      1. Haz clic en Agregar etiqueta y, en el campo Clave, ingresa un nombre para la etiqueta. Los nombres de las etiquetas deben comenzar con una letra minúscula y contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa severity.
      2. Haga clic en Valor y, luego, ingrese un valor para su etiqueta. Los valores de las etiquetas pueden contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa critical.

      Si deseas obtener información sobre cómo puedes usar las etiquetas de política para ayudarte a administrar tus alertas, consulta Anota alertas con etiquetas.

    5. Para incluir la documentación personalizada con una notificación, ingresa ese contenido en la sección Documentación. Para darle formato a tu documentación, puedes usar Markdown. Para extraer información de la política a fin de adaptar el contenido de tu documentación, puedes usar variables. Por ejemplo, la documentación puede incluir un título como Addressing High CPU Usage y detalles que identifiquen el proyecto:

      ## Addressing High CPU Usage
      
      This note contains information about high CPU Usage.
      
      You can include variables in the documentation. For example:
      
      This alert originated from the project ${project}, using
      the variable $${project}.
      

      Cuando se crean las notificaciones, Monitoring reemplaza las variables con sus valores. Los valores reemplazan las variables solo en las notificaciones. En el panel de vista previa y en otros lugares de la consola de Google Cloud, solo se muestra el formato de Markdown:

      Ejemplo de escritura de una nota de documentación con Markdown.

      Para obtener más información, consulta Anota alertas con la documentación definida por el usuario y Usa los controles del canal.

    6. Haz clic en Nombre de la alerta y, luego, ingresa un nombre para la política de alertas.

  7. Haz clic en Crear política.

Filtrar las series temporales seleccionadas

Puedes reducir la cantidad de datos que se supervisan si especificas los criterios de filtro o si aplicas la agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo que puede mejorar el rendimiento de la alerta.

Cuando proporcionas varios criterios de filtrado, solo se supervisan las series temporales que cumplen con todos los criterios.

Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, usa el campo Filtro para seleccionar el criterio que deseas filtrar. Por ejemplo, puedes filtrar por grupo de recursos, por nombre, por etiqueta de recurso, por zona y por etiqueta de métrica. Después de seleccionar el criterio del filtro, completa el filtro mediante la selección del operador de comparación y el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:

OperadorSignificadoEjemplo
= Igualdad resource.labels.zone = "us-central1-a"
!= Desigualdad resource.labels.zone != "us-central1-a"
=~ Igualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
!=~ Desigualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
starts_with El valor comienza con resource.labels.zone = starts_with("us")
ends_with El valor termina con resource.labels.zone = ends_with("b")
has_substring El valor contiene resource.labels.zone = has_substring("east")
one_of Uno de resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with El valor no comienza con resource.labels.zone != starts_with("us")
!ends_with El valor no termina con resource.labels.zone != ends_with("b")
!has_substring El valor no contiene resource.labels.zone != has_substring("east")
!one_of El valor no es uno de resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Solucionar problemas

Esta sección contiene sugerencias para solucionar problemas.

La métrica no aparece en el menú de las métricas disponibles

Para supervisar una métrica que no aparece en el menú Seleccionar una métrica, realiza una de las siguientes acciones:

  • Para crear una política de alertas que supervise una métrica de Google Cloud, expande el menú Seleccionar una métrica y, luego, inhabilita el botón de activación Mostrar solo recursos y métricas activos. Cuando se inhabilita, en el menú se enumeran todas las métricas de los servicios de Google Cloud y todas las métricas con datos.

  • A fin de configurar una alerta para un tipo de métrica personalizado antes de que este genere datos, debes especificar el tipo de métrica mediante un filtro de Monitoring:

    1. Selecciona ? en la sección Seleccionar métrica y, luego, selecciona Modo de filtro directo en la información sobre la herramienta.
    2. Ingresa un filtro de supervisión o un selector de series temporales. Para obtener información sobre la sintaxis, consulta los siguientes documentos:

Cómo supervisar una velocidad de cambio

Para supervisar la velocidad de cambio de un valor de métrica, establece el campo Función de ventana progresiva en Porcentaje de cambio y, luego, Monitoring compara la tasa de cambio de la métrica con el umbral. Cuando seleccionas la función de porcentaje de cambio, Monitoring hace lo siguiente:

  1. Si la serie temporal tiene un tipo de métrica DELTA o CUMULATIVE, la serie temporal se convierte en una que tiene un tipo de métrica GAUGE. Para obtener información sobre la conversión, consulta Tipos, tipos y conversiones.
  2. Para calcular el porcentaje, se compara el valor promedio de la ventana de 10 minutos más reciente con el valor promedio de la ventana de 10 minutos antes de que se vuelva a probar la ventana.

La ventana de visualización de 10 minutos es un valor fijo, no se puede cambiar. Sin embargo, debes especificar el período para volver a probar cuando creas una condición.

¿Qué sigue?