Crea políticas de alertas sobre el valor de las métricas previstas

En este documento, se describe cómo usar la consola de Google Cloud para crear una alerta que envía notificaciones cuando la política predice que se infringirá el umbral en la próxima período de previsión. Una previsión predice si una serie temporal infringir un umbral dentro de una ventana de previsión, que es un período en el en el futuro. La ventana de previsión puede variar Entre 1 hora (3,600 segundos) y 2.5 días (216,000 segundos)

Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando un un mensaje específico en tus registros, consulta Supervisa tus registros.

En este documento, no se describe lo siguiente:

Acerca de las condiciones de previsión

Puedes usar la previsión cuando supervisas la mayoría de las métricas. Sin embargo, cuando supervisas un recurso limitado, como la cuota, el espacio en disco o el uso de memoria, una previsión puede notificarte antes de que se infrinja el umbral. Esa capacidad te da más tiempo para responder a cómo el recurso limitado se consume antes de que se infrinja el umbral.

Para cada serie temporal que supervisa una condición de previsión, la condición una instancia de un algoritmo de decisión. Una vez que el algoritmo está entrenado, para generar una previsión cada vez que se evalúe la condición. Cada previsión una predicción de que su serie temporal incumplirá o no, el umbral dentro del período de previsión. Si una serie temporal supervisada tiene periódica, entonces el algoritmo de decisión para para que las series temporales incorporen el comportamiento periódico en sus previsiones.

Se cumple una condición de previsión cuando se produce una de las siguientes situaciones (o ambas):

  • Todos los valores de una serie temporal durante un período específico de nueva prueba si infringen el umbral.
  • Todas las previsiones para una serie temporal específica que se realizan en un período de repetición predecir que la serie temporal incumplirá el umbral dentro del período de previsión.

El tiempo de entrenamiento inicial de un algoritmo de decisión es el doble de la duración del período de previsión. Por ejemplo, si el período de previsión es de una hora, entonces se requieren dos horas de tiempo de entrenamiento. El algoritmo de decisión para cada series temporales se entrenan de forma independiente. Mientras se procesa un algoritmo de decisión entrenamiento, su serie temporal cumple con la condición solo cuando los valores de las series temporales incumplen el umbral del período especificado para volver a probar.

Una vez completado el entrenamiento inicial, cada algoritmo de decisión se entrenó con datos que abarcan hasta seis veces la duración del período de previsión. Por ejemplo, cuando el período de previsión es de una hora, las seis horas más recientes de datos durante el entrenamiento continuo.

Cuando configuras una condición de previsión y luego dejan de llegar los datos para obtener más de 10 minutos, la previsión está inhabilitada y la condición funciona como una condición de umbral de métrica.

Los incidentes se crean cuando la previsión predice que una serie temporal incumplirá el umbral de la condición dentro del período de previsión. Monitoring cierra automáticamente el incidente cuando la previsión predice que las series temporales no infringirán el umbral dentro del período de pronóstico.

Antes de comenzar

  1. Si deseas obtener los permisos que necesitas para crear y modificar políticas de alertas con la consola de Google Cloud, solicita a tu administrador que te otorgue el Rol de IAM de Editor de Monitoring (roles/monitoring.editor) en tu proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

    Para obtener más información sobre los roles de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

  2. Asegúrate de estar familiarizado con los conceptos generales de las políticas de alertas. Para obtener más información sobre estos temas, consulta Descripción general de las alertas.

  3. Configura los canales de notificaciones que deseas usar para recibir cualquier notificaciones. Para fines de redundancia, te recomendamos crear varios tipos de canales de notificación. Para obtener más información, consulta Crea y administra canales de notificaciones.

Crear política de alertas

Para crear una política de alertas que envíe una notificación basada en una previsión, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página  Alertas.

    Ir a las Alertas

    Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.

  2. Selecciona Crear política.
  3. Selecciona las series temporales que deseas supervisar:

    1. Haz clic en Seleccionar una métrica y navega por los menús para elegir una tipo de recurso y tipo de métrica y, luego, haz clic en Aplicar.

      El menú Selecciona una métrica (Select a metric) contiene funciones que te ayudan a encontrar los tipos de métricas disponibles:

      • Para encontrar un tipo de métrica específico, usa la Barra de filtros. Por ejemplo, si ingresas util, restringirás el menú a mostrar entradas que incluyan util. Las entradas se muestran cuando pasan un elemento "contiene" que no distingue mayúsculas de minúsculas la prueba.
      • Para mostrar todos los tipos de métricas, incluso las que no tienen datos, haz clic en Activa. De forma predeterminada, los menús solo mostrar tipos de métricas con datos. Para obtener más información, consulta La métrica no aparece en el menú.

      Puedes supervisar cualquier métrica integrada o cualquier métrica definida por el usuario que tiene un tipo de valor de double o int64 que es una métrica de restricción y no es una métrica para un Instancia de VM de Amazon.

      Si seleccionas un tipo de métrica que genera más de 64 series temporales que se supervisan, luego, La supervisión genera previsiones para las 64 series temporales cuyos valores son más cercanos o que ya no alcancen el umbral. Para otro series temporales, sus valores se comparan con el umbral.

    2. Opcional: Para supervisar un subconjunto de las series temporales que coincidan con el los tipos de métricas y recursos que seleccionaste en el paso anterior Haz clic en Agregar filtro. En el diálogo de filtro, selecciona la etiqueta por un comparador y, luego, el valor del filtro. Por ejemplo, el filtro zone =~ ^us.*.a$ usa una expresión regular para hacer coincidir todos los datos de series temporales cuyo nombre de zona comience con us y finalice con a. Para obtener más información, consulta Filtra las series temporales seleccionadas.

    3. Opcional: Para cambiar la alineación de los puntos en una serie temporal, En la sección Transforma los datos, configura la ventana progresiva y Campos de la función de ventana progresiva.

      Estos campos especifican la forma en que se almacenan los puntos que se registran en una ventana de varias condiciones. Por ejemplo, supongamos que la ventana es de 15 minutos y que función analítica es max. El punto alineado es el valor máximo de todas puntos en los últimos 15 minutos. Para obtener más información, consulta Alineación: regularización dentro de la serie.

      También puedes supervisar la velocidad a la que cambia el valor de una métrica Para ello, usa el campo Función de ventana progresiva a cambio porcentual. Para obtener más información, consulta Supervisa una tasa de cambio.

    4. Opcional: Combina series temporales cuando quieras reducir la cantidad de series temporales supervisadas por una política o cuando quieres supervisar una colección de series temporales. Por ejemplo, en lugar de supervisar de uso de CPU de cada instancia de VM, puedes calcular promedio del uso de CPU de todas las VMs en una zona y, luego, supervisar ese promedio. De forma predeterminada, series temporales no se combinan. Para obtener información general, consulta Reducción: combinación de series temporales.

      Para combinar todas las series temporales, haz lo siguiente:

      1. En la sección En todas las series temporales, haz lo siguiente: Haz clic en Expandir.
      2. Establece el campo Agregación de serie temporal en un valor distinto del none. Por ejemplo, para mostrar el valor promedio de la series temporales, selecciona mean.
      3. Asegúrate de que el campo Series temporales agrupar por esté vacío.

      Para combinar o agrupar series temporales por valores de etiqueta, haz lo siguiente:

      1. En la sección En todas las series temporales, haz lo siguiente: Haz clic en Expandir.
      2. Establece el campo Agregación de serie temporal en un valor distinto del none.
      3. En el campo Series temporales, agrupar por, selecciona las etiquetas por qué agrupar.

      Por ejemplo, si agrupas por etiqueta zone y, luego, estableces a un valor de mean, el gráfico muestra una serie temporal para cada zona sobre la que hay datos. El Las series temporales que se muestran para una zona específica son el promedio de todas las series temporales con esa zona.

    5. Haz clic en Siguiente.

  4. Configura el activador de la condición:

    1. Selecciona Previsión para el tipo de condición.

    2. Selecciona un valor para el menú Activador de alertas. Este menú te permite especificar el subconjunto de series temporales que deben infringir el umbral antes de que se cumpla la condición.

    3. Selecciona un valor para la ventana Forecast. El valor que selecciones es la cantidad de tiempo en el futuro para la previsión. Debes establecer este valor como mínimo entre 1 hora (3,600 segundos) y la mayoría de los 2.5 días (216,000 segundos).

    4. Ingrese cuándo el valor previsto de la métrica seleccionada incumple el umbral con el valor de Posición del umbral Campos Threshold value Por ejemplo, si estableces estos valores en Above threshold y 10, entonces cualquier valor previsto mayor que 10 infringe el umbral.

    5. Opcional: Expande Opciones avanzadas y establece el valor del Ventana Volver a probar. El valor predeterminado de este campo es No retest. Te recomendamos que establezcas este campo en 10 minutos como mínimo.

      Por ejemplo, supongamos que configuras la condición de previsión de modo que cualquier series temporales puede hacer que se cumpla la condición. También supón que el El período para volver a probar se establece en 15 minutos, y el período de previsión está establecido. 1 hora, y se produce un incumplimiento cuando el valor de la serie temporal sea superior al Umbral, que está establecido en 10. La condición se cumple si ocurre alguna de las siguientes situaciones:

      • Todos los valores de una serie temporal son superiores a 10 y permanecen allí durante al menos 15 minutos.
      • En intervalos de 15 minutos, cada previsión de una serie temporal predice que su valor elevará más que el umbral de 10 en algún momento en el transcurso de una hora.
    6. Opcional: Para especificar cómo Monitoring evalúa la estado cuando los datos dejen de llegar, expande Opciones avanzadas y, luego, usa el menú Evaluación datos faltantes.

      El menú Evaluación faltan datos se inhabilita cuando el valor del atributo La ventana para volver a probar es No se debe volver a probar.

      Cuando faltan datos por más de 10 minutos, una condición de previsión deja de En su lugar, usa el valor de la métrica Datos faltantes de la evaluación para determinar cómo administrar incidentes. Cuando se reinician las observaciones, se reinicia la previsión.

      Consola de Google Cloud
      "Evaluación de datos faltantes" campo
      Resumen Detalles
      Datos faltantes vacíos Los incidentes abiertos permanecen abiertos.
      No se abren los incidentes nuevos.

      Para las condiciones que se cumplen, la condición sigue siendo se cumplen cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no hay datos llega, el temporizador de cierre automático comienza luego de una demora de al menos 15 minutos. Si el temporizador expira, se cierra el incidente.

      En el caso de las condiciones que no se cumplen, la condición sigue cuando los datos dejen de llegar.

      Datos faltantes que se consideran valores que incumplen la condición de la política Los incidentes abiertos permanecen abiertos.
      Se pueden abrir incidentes nuevos.

      Para las condiciones que se cumplen, la condición sigue siendo se cumplen cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos durante el cierre automático más 24 horas se cierra el incidente.

      En el caso de las condiciones que no se cumplen, este parámetro de configuración hace que condición de umbral de métrica para comportarse como un metric-absence condition. Si los datos no llegan en el tiempo especificado en el período para volver a probar, entonces la condición se evalúa como cumplida. Para una política de alertas con una condición, la condición de cumplirse y, como resultado, se abre un incidente.

      Datos faltantes que se consideran valores que no incumplen la condición de la política Los incidentes abiertos están cerrados.
      No se abren los incidentes nuevos.

      Para las condiciones que se cumplen, la condición deja de cumplirse cuando dejan de llegar los datos. Si hay un incidente abierto para esta condición, se cierra el incidente.

      En el caso de las condiciones que no se cumplen, la condición sigue cuando los datos dejen de llegar.

    7. Haz clic en Siguiente.

  5. Opcional: Crea una política de alertas con varias condiciones.

    La mayoría de las políticas supervisan un solo tipo de métrica. supervisar la cantidad de bytes escritos en una instancia de VM. Cuando quieras para supervisar varios tipos de métricas, crea una política con varias condiciones. Cada condición supervisa un tipo de métrica. Después de crear las condiciones, especificas cómo se combinan las condiciones. Para obtener más información, consulta Políticas con varias condiciones.

    Para crear una política de alertas con varias condiciones, haz lo siguiente:

    1. Para cada condición adicional, haz clic en Agregar condición de alerta y, luego, configurar esa condición.
    2. Haz clic en Siguiente y configura cómo se combinan las condiciones.
    3. Haz clic en Siguiente para avanzar a las notificaciones y la documentación. configurar.
  6. Configura las notificaciones:

    1. Expande el menú Notificaciones y nombre y selecciona tu notificación. canales. Para fines de redundancia, recomendamos que agregues a un política de alertas de varios tipos de canales de notificación. Para obtener más información, consulta Cómo administrar canales de notificaciones.

    2. Opcional: Para recibir una notificación cuando se cierre un incidente, selecciona Notificar el cierre del incidente. De forma predeterminada, cuando creas una política de alertas con el en la consola de Google Cloud, se envía una notificación solo cuando crear.

    3. Opcional: Para cambiar el tiempo que espera Monitoring antes cerrar un incidente después de que los datos dejan de llegar, selecciona una opción del Menú Duración del cierre automático de incidentes. De forma predeterminada, cuando dejan de llegar los datos, Monitoring espera siete días antes de cerrar un incidente abierto.

    4. Selecciona una opción del menú Nivel de gravedad de la política. Incidentes e las notificaciones muestran el nivel de gravedad.

    5. Opcional: Para agregar etiquetas personalizadas a la política de alertas, en En la sección Etiquetas de usuario de la política, haz lo siguiente:

      1. Haz clic en Agregar etiqueta y, en el campo Clave, ingresa un nombre para el etiqueta. Los nombres de las etiquetas deben comenzar con una letra minúscula y pueden Debe contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa severity.
      2. Haz clic en Valor y, luego, ingresa un valor para tu etiqueta. Los valores de las etiquetas pueden Debe contener letras minúsculas, números, guiones bajos y guiones. Por ejemplo, ingresa critical.

      Para obtener información sobre cómo usar etiquetas de política tus notificaciones, consulta Anota incidentes con etiquetas.

  7. Opcional: En la sección Documentation, ingresa el contenido que quieras. que se incluye en la notificación.

    Para dar formato a tu documentación, puedes usar texto sin formato, Markdown y variables. También puedes incluir vínculos para ayudar a los usuarios a depurar el incidente, como vínculos a guías internas, paneles de Google Cloud y páginas. Por ejemplo, en la siguiente plantilla de documentación, se describe una CPU de uso para un recurso gce_instance y, además, incluye varias variables para hacer referencia a la política de alertas y acondicionar REST de Google Cloud. La plantilla de documentación y, luego, dirige a los lectores a páginas externas para que ayuden con la depuración.

    Cuando se crean las notificaciones, Monitoring reemplaza las variables de la documentación con sus valores. Los valores reemplazan las variables solo en las notificaciones. El Panel de vista previa y otros lugares de la consola de Google Cloud mostrará únicamente el formato Markdown.

    Vista previa

    ## CPU utilization exceeded
    
    ### Summary
    
    The ${metric.display_name} of the ${resource.type}
    ${resource.label.instance_id} in the project ${resource.project} has
    exceeded 90% for over 15 minutes.
    
    ### Additional resource information
    
    Condition resource name: ${condition.name}  
    Alerting policy resource name: ${policy.name}  
    
    ### Troubleshooting and Debug References
    
    Repository with debug scripts: example.com  
    Internal troubleshooting guide: example.com  
    ${resource.type} dashboard: example.com
    

    Formato de las notificaciones

    Ejemplo de cómo se renderiza la documentación en una notificación.

    Para obtener más información, consulta Anota las notificaciones con documentación definida por el usuario y Cómo usar los controles del canal.

  8. Haz clic en Nombre de la alerta y, luego, ingresa un nombre para la política de alertas.

  9. Haz clic en Crear política.

Filtra las series temporales seleccionadas

Los filtros garantizan que solo se muestren las series temporales que cumplen supervisar. Cuando aplica filtros, puede reducir el número de líneas en el gráfico lo que puede mejorar el rendimiento del gráfico. También puedes reducir el de datos que se supervisan mediante la aplicación de agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo cual puede mejorar el rendimiento de la alerta.

Un filtro consta de una etiqueta, un comparador y un valor. Por ejemplo: para que coincida con todas las series temporales cuya etiqueta zone comienza con "us-central1", podrías usar el filtro zone=~"us-central1.*", que usa una expresión regular para realizar la comparación.

Cuando filtras por ID del proyecto o contenedor de recursos, debes usar el operador igual, (=). Cuando filtras por otras etiquetas, puedes usar cualquier comparador compatible. Por lo general, puedes filtrar las etiquetas de métricas y recursos, y grupo de recursos.

Cuando proporcionas varios criterios de filtrado, Solo se supervisan las series temporales que cumplen con todos los criterios.

Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, utiliza el campo Filtro para seleccionar la criterio por el cual filtrar, seleccionar el operador de comparación y, luego, seleccionar el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:

OperadorSignificadoEjemplo
= Igualdad resource.labels.zone = "us-central1-a"
!= Desigualdad resource.labels.zone != "us-central1-a"
=~ Igualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
!=~ Desigualdad de expresión regular 2 monitoring.regex.full_match("^us.*")
starts_with El valor comienza con resource.labels.zone = starts_with("us")
ends_with El valor termina con resource.labels.zone = ends_with("b")
has_substring El valor contiene resource.labels.zone = has_substring("east")
one_of Uno de resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with El valor no comienza con resource.labels.zone != starts_with("us")
!ends_with El valor no termina con resource.labels.zone != ends_with("b")
!has_substring El valor no contiene resource.labels.zone != has_substring("east")
!one_of El valor no es uno de resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Solucionar problemas

En esta sección, se incluyen sugerencias para solucionar problemas.

La métrica no aparece en el menú de métricas disponibles

Para supervisar una métrica que no aparece en el menú Selecciona una métrica, una de las siguientes opciones:

  • Para crear una política de alertas que supervise una métrica de Google Cloud, sigue estos pasos: expande el menú Seleccionar una métrica y, luego, Haz clic en Activa. Cuando se inhabilita, el menú enumera todas las métricas de los servicios de Google Cloud y todas las métricas con datos.

  • Para configurar una condición para un tipo de métrica personalizada antes de esa métrica genera datos, debes especificar el tipo de métrica con un Filtro de supervisión:

    1. Selecciona ? en el encabezado de la sección Seleccionar métrica y, luego, elige Modo de filtro directo en la información sobre la herramienta
    2. Ingresa un filtro de supervisión o un selector de series temporales. Para obtener información sobre la sintaxis, consulta los siguientes documentos:

Supervisar una tasa de cambio

Para supervisar la tasa de cambio de un valor de métrica, establece la Campo función de ventana progresiva a porcentaje de cambio Cuando se evalúa la condición, Monitoring calcula la tasa de cambio de la métrica como un porcentaje y, luego, compara ese porcentaje al umbral de la condición. Este proceso de comparación sigue dos pasos:

  1. Si la serie temporal tiene un tipo de métrica DELTA o CUMULATIVE, entonces la serie temporal se convierte en una que tiene una categoría de métrica GAUGE. Para obtener información sobre el consulta Tipos, tipos y conversiones.
  2. Monitoring calcula el porcentaje modificado mediante la comparación el valor promedio en la ventana variable de 10 minutos más reciente al valor promedio de la ventana variable de 10 minutos antes del comienzo de el período de alineación.

No puedes cambiar la ventana deslizante de 10 minutos que se usa para las comparaciones en una política de alertas de tasa de cambio. Sin embargo, debes especificar el período de alineación cuando creas la condición.

Restricciones

  • Puedes configurar la condición usando la interfaz basada en menús de la la consola de Google Cloud o mediante filtros de Monitoring. No puedes configurar la condición con el lenguaje de consulta de Monitoring o PromQL.
  • Todas las métricas con un tipo de valor de double o int64 se excepto las de las instancias de VM de Amazon.

¿Qué sigue?