En este documento, se describe cómo usar la consola de Google Cloud para crear una política de alertas que envíe notificaciones cuando una serie temporal supervisada no tenga datos durante un período específico.
Las condiciones de ausencia de métricas requieren al menos una medición correcta, una que recupere datos, dentro del período máximo después de que se instaló o modificó la política. Este período se denomina tiempo de ausencia del activador. El tiempo máximo de ausencia del activador configurable es de 23.5 horas.
Por ejemplo, supongamos que estableces el tiempo de ausencia del activador en una política de ausencia de la métrica en 30 minutos. La condición no se cumplirá cuando el subsistema que escribe datos de la métrica nunca haya escrito un dato. El subsistema debe generar al menos un dato y, luego, tener errores en generar datos adicionales durante 30 minutos.
Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en tus registros, consulta Supervisa tus registros.
En este documento, no se describe lo siguiente:
- Cómo recibir notificaciones cuando los valores de una métrica son superiores o inferiores a un umbral Para obtener más información, consulta Crea políticas de alertas de límite de métrica.
- Cómo recibir notificaciones en función del valor previsto de una métrica Para obtener más información, consulta Crea políticas de alertas de valores de métricas previstos.
Cómo crear una política de alertas con la API de Cloud Monitoring Para obtener más información, consulta Crea políticas de alertas con la API.
Cómo crear una política de alertas cuya condición incluya una consulta del lenguaje de consulta de Monitoring (MQL) Estas políticas pueden usar un umbral dinámico o estático. Para obtener más información, consulta los siguientes documentos:
Antes de comenzar
-
Para obtener los permisos que necesitas para crear y modificar políticas de alertas con la consola de Google Cloud, pídele a tu administrador que te otorgue el rol de IAM de editor de Monitoring (
roles/monitoring.editor
) en tu proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Para obtener más información sobre los roles de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.
Asegúrate de estar familiarizado con los conceptos generales de las políticas de alertas. Para obtener información sobre estos temas, consulta Descripción general de alertas.
Configura los canales de notificaciones que deseas usar para recibir notificaciones. Para fines de redundancia, te recomendamos que crees varios tipos de canales de notificaciones. Para obtener más información, consulta Cómo crear y administrar canales de notificaciones.
Crear política de alertas
Para crear una política de alertas que envíe notificaciones cuando una serie temporal supervisada no tenga datos para un tiempo de ausencia de activador específico, haz lo siguiente:
-
En la consola de Google Cloud, ve a la página notifications Alertas.
Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.
- Selecciona Crear política.
Selecciona las series temporales que deseas supervisar:
Haz clic en Seleccionar una métrica, navega por los menús para seleccionar un tipo de recurso y una métrica, y, luego, haz clic en Aplicar.
El menú Seleccionar una métrica contiene funciones que te ayudan a encontrar los tipos de métricas disponibles:
- Para encontrar un tipo de métrica específico, usa la barra de filtros filter_list.
Por ejemplo, si ingresas
util
, restringes el menú para que muestre entradas que incluyanutil
. Las entradas se muestran cuando pasan una prueba de "contiene" que no distingue mayúsculas de minúsculas.
Puedes supervisar cualquier métrica integrada o cualquier métrica definida por el usuario.
- Para encontrar un tipo de métrica específico, usa la barra de filtros filter_list.
Por ejemplo, si ingresas
Opcional: Para supervisar un subconjunto de las series temporales que coincidan con las métricas y los tipos de recursos que seleccionaste en el paso anterior, haz clic en Agregar filtro. En el diálogo del filtro, selecciona la etiqueta por la que se filtrará, un comparador y, luego, el valor del filtro. Por ejemplo, el filtro
zone =~ ^us.*.a$
usa una expresión regular para hacer coincidir todos los datos de series temporales cuyo nombre de zona comienza conus
y termina cona
. Para obtener más información, consulta Cómo filtrar las series temporales seleccionadas.Opcional: Para cambiar la forma en que los puntos de una serie temporal están alineados, en la sección Transforma datos, configura los campos Ventana móvil y Función de ventana móvil.
Si supervisas una métrica basada en registros, te recomendamos que el menú Ventana continua esté configurado en al menos 10 minutos.
Estos campos especifican cómo se combinan los puntos que se registran en una ventana. Por ejemplo, supongamos que la ventana es de 15 minutos y la función analítica es
max
. El punto alineado es el valor máximo de todos los puntos en los 15 minutos más recientes. Para obtener más información, consulta Alineación: regularización dentro de la serie.Opcional: Combina series temporales cuando quieras reducir la cantidad de series temporales que supervisa una política o cuando quieras supervisar solo una colección de series temporales. Por ejemplo, en lugar de supervisar el uso de CPU de cada instancia de VM, te recomendamos que calcules el promedio del uso de CPU de todas las VMs de una zona y, luego, supervises ese promedio. De forma predeterminada, las series temporales no se combinan. Para obtener información general, consulta Reducción: Combinación de series temporales.
Para combinar todas las series temporales, haz lo siguiente:
- En la sección Serie temporal, haz clic en expand_more Expandir.
- Establece el campo Agregación de series temporales en un valor distinto de
none
. Por ejemplo, para mostrar el valor promedio de la serie temporal, seleccionamean
. - Asegúrate de que el campo Agrupar por series temporales esté vacío.
Para combinar o agrupar series temporales por valores de etiqueta, haz lo siguiente:
- En la sección Serie temporal, haz clic en expand_more Expandir.
- Establece el campo Agregación de series temporales en un valor distinto de
none
. - En el campo Agrupar series temporales por, selecciona las etiquetas con las que deseas agruparlas.
Por ejemplo, si agrupas por la etiqueta
zone
y, luego, configuras el campo de agregación en un valor demean
, el gráfico mostrará una serie temporal para cada zona para la que haya datos. La serie temporal que se muestra para una zona específica es el promedio de todas las series temporales con esa zona.Haz clic en Siguiente.
Para configurar el activador de condiciones, sigue estos pasos:
Selecciona Ausencia de métricas para el tipo de condición.
Opcional: Actualiza el menú Activador de alertas, que tiene los siguientes valores:
Cualquier serie temporal es una infracción: Es la configuración predeterminada. Cualquier serie temporal con datos ausentes para todo el período de ausencia del activador hace que se cumpla la condición.
El porcentaje de series temporales es una infracción: Un porcentaje de series temporales debe tener datos ausentes para todo el período de ausencia del activador antes de que se cumpla la condición. Por ejemplo, podrías recibir una notificación cuando el 50% de las series temporales supervisadas no tengan datos para todo el tiempo de ausencia del activador.
La cantidad de series temporales es una infracción: Una cantidad específica de series temporales debe tener datos ausentes durante todo el período de ausencia del activador antes de que se cumpla la condición. Por ejemplo, podrías recibir una notificación cuando 32 de las series temporales supervisadas no tengan datos para todo el tiempo de ausencia del activador.
Todas las series temporales son una infracción: Todas las series temporales deben tener datos ausentes durante todo el tiempo de ausencia del activador antes de que se cumpla la condición.
Para obtener información sobre los intervalos que usa la supervisión para alinear y medir los datos de las series temporales, consulta Períodos de alineación y ventanas de nueva prueba.
Especifica durante cuánto tiempo deben estar ausentes los datos de métricas antes de que la supervisión te notifique mediante el campo Tiempo de ausencia del activador.
Haz clic en Siguiente.
Opcional: Crea una política de alertas con varias condiciones.
La mayoría de las políticas supervisan un solo tipo de métrica. Por ejemplo, una política podría supervisar la cantidad de bytes escritos en una instancia de VM. Cuando desees supervisar varios tipos de métricas, crea una política con varias condiciones. Cada condición supervisa un tipo de métrica. Después de crear las condiciones, debes especificar cómo se combinan. Para obtener información, consulta Políticas con varias condiciones.
Para crear una política de alertas con varias condiciones, haz lo siguiente:
- Para cada condición adicional, haz clic en Agregar condición de alerta y, luego, configura esa condición.
- Haz clic en Siguiente y configura cómo se combinan las condiciones.
- Haz clic en Siguiente para avanzar a la configuración de notificaciones y documentación.
Configura las notificaciones:
Expande el menú Notificaciones y nombre y selecciona tus canales de notificaciones. Para fines de redundancia, te recomendamos que agregues a una política de alertas varios tipos de canales de notificaciones. Para obtener más información, consulta Administra canales de notificaciones.
Para recibir notificaciones cuando se cierre un incidente, selecciona Notificar cuando se cierre un incidente. De forma predeterminada, cuando creas una política de alertas con la consola de Google Cloud, solo se envía una notificación cuando se crea un incidente.
Opcional: Para cambiar el tiempo que espera la supervisión antes de cerrar un incidente después de que dejan de llegar datos, selecciona una opción del menú Duración del cierre automático de incidentes. De forma predeterminada, cuando dejan de llegar datos, Monitoring espera siete días antes de cerrar un incidente abierto.
Selecciona una opción del menú Nivel de gravedad de la política. Los incidentes y las notificaciones muestran el nivel de gravedad.
Opcional: Para agregar etiquetas personalizadas a la política de alertas, en la sección Etiquetas de usuario de la política, haz lo siguiente:
- Haz clic en Agregar etiqueta y, en el campo Clave, ingresa un nombre para la etiqueta. Los nombres de las etiquetas deben comenzar con una letra minúscula y pueden contener letras en minúscula, números, guiones bajos y guiones.
Por ejemplo, ingresa
severity
. - Haz clic en Valor y, luego, ingresa un valor para tu etiqueta. Los valores de etiquetas pueden contener letras minúsculas, números, guiones bajos y guiones.
Por ejemplo, ingresa
critical
.
Si deseas obtener información para usar etiquetas de políticas que te ayuden a administrar tus notificaciones, consulta Cómo anotar incidentes con etiquetas.
- Haz clic en Agregar etiqueta y, en el campo Clave, ingresa un nombre para la etiqueta. Los nombres de las etiquetas deben comenzar con una letra minúscula y pueden contener letras en minúscula, números, guiones bajos y guiones.
Por ejemplo, ingresa
Opcional: En la sección Documentación, ingresa el contenido que quieras incluir con la notificación.
Para dar formato a tu documentación, puedes usar texto sin formato, Markdown y variables. También puedes incluir vínculos para ayudar a los usuarios a depurar el incidente, como vínculos a manuales internos, paneles de Google Cloud y páginas externas. Por ejemplo, en la siguiente plantilla de documentación, se describe un incidente de uso de la CPU para un recurso
gce_instance
y se incluyen varias variables para hacer referencia a la política de alertas y a los recursos REST de la condición. Luego, la plantilla de documentación dirige a los lectores a páginas externas para ayudar con la depuración.Cuando se crean notificaciones, la supervisión reemplaza las variables de documentación por sus valores. Los valores reemplazan a las variables solo en las notificaciones. El panel de vista previa y otros lugares de la consola de Google Cloud solo muestran el formato de Markdown.
Vista previa
## CPU utilization exceeded ### Summary The ${metric.display_name} of the ${resource.type} ${resource.label.instance_id} in the project ${resource.project} has exceeded 90% for over 15 minutes. ### Additional resource information Condition resource name: ${condition.name} Alerting policy resource name: ${policy.name} ### Troubleshooting and Debug References Repository with debug scripts: example.com Internal troubleshooting guide: example.com ${resource.type} dashboard: example.com
Formato de la notificación
Para obtener más información, consulta Cómo anotar notificaciones con documentación definida por el usuario y Cómo usar los controles de canal.
Haz clic en Nombre de la alerta y, luego, ingresa un nombre para la política de alertas.
Haz clic en Crear política.
Cómo filtrar las series temporales seleccionadas
Los filtros garantizan que solo se supervisen las series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, puedes reducir la cantidad de líneas en el gráfico, lo que puede mejorar su rendimiento. También puedes reducir la cantidad de datos que se supervisan aplicando la agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo que puede mejorar el rendimiento de la alerta.
Un filtro se compone de una etiqueta, un comparador y un valor. Por ejemplo, para hacer coincidir todas las series temporales cuya etiqueta zone
comienza con "us-central1"
, puedes usar el filtro zone=~"us-central1.*"
, que usa una expresión regular para realizar la comparación.
Cuando filtras por el ID del proyecto o el contenedor de recursos, debes usar el operador de igualdad, (=)
. Cuando filtras por otras etiquetas, puedes usar cualquier comparador compatible.
Por lo general, puedes filtrar etiquetas de métricas y recursos, y por grupo de recursos.
Cuando proporcionas varios criterios de filtrado, solo se supervisan las series temporales que cumplen con todos los criterios.
Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, usa el campo Filtro para seleccionar el criterio que deseas filtrar, selecciona el operador de comparación y, luego, selecciona el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:
Operador | Significado | Ejemplo |
---|---|---|
= |
Igualdad | resource.labels.zone = "us-central1-a" |
!= |
Desigualdad | resource.labels.zone != "us-central1-a" |
=~ |
Igualdad de expresión regular 2 | monitoring.regex.full_match("^us.*") |
!=~ |
Desigualdad de expresión regular 2 | monitoring.regex.full_match("^us.*") |
starts_with |
El valor comienza con | resource.labels.zone = starts_with("us") |
ends_with |
El valor termina con | resource.labels.zone = ends_with("b") |
has_substring |
El valor contiene | resource.labels.zone = has_substring("east") |
one_of |
Uno de | resource.labels.zone = one_of("asia-east1-b", "europe-north1-a") |
!starts_with |
El valor no comienza con | resource.labels.zone != starts_with("us") |
!ends_with |
El valor no termina con | resource.labels.zone != ends_with("b") |
!has_substring |
El valor no contiene | resource.labels.zone != has_substring("east") |
!one_of |
El valor no es uno de | resource.labels.zone != one_of("asia-east1-b", "europe-north1-a") |