En este documento, se describen los campos que estableces cuando configuras la condición de una política de alertas. Por lo general, creas una política de alertas si deseas recibir notificaciones cuando los datos de series temporales, como el uso de CPU de una máquina virtual, cumplen ciertas condiciones. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en tus registros, consulta Supervisar tus registros.
En este documento, se usa la terminología que usa la interfaz basada en menús de Google Cloud Console. Sin embargo, la información conceptual se aplica a todos los enfoques que puedes usar para crear una política de alertas. Para obtener información sobre el uso de la API de Cloud Monitoring, consulta Políticas de alertas en la API de Cloud Monitoring.
Selecciona los datos que se mostrarán
Para especificar las métricas que se mostrarán cuando se cree una política de alertas, debes especificar valores para una métrica y un tipo de recurso:
Para configurar una condición en una política de alertas, puedes usar la API de Cloud Monitoring o Google Cloud Console. El diálogo predeterminado que se usa para crear una política de alertas cuando usas Google Cloud Console se controla mediante un menú. Sin embargo, si prefieres usar el lenguaje de consulta de Monitoring (MQL), puedes configurar Google Cloud Console para activar un editor de MQL.
No todas las series temporales se pueden representar con una métrica y un modelo de recursos. Por ejemplo, no puedes especificar una métrica y un recurso cuando quieres supervisar la cantidad de procesos que se ejecutan en una máquina virtual (VM). En situaciones como estas, configura Google Cloud Console para que abra el modo de filtro directo.
Modo predeterminado
Usa el modo predeterminado cuando desees configurar una condición que supervise un tipo de métrica para un tipo de recurso específico y no desees usar el lenguaje de consulta de supervisión (MQL). De forma predeterminada, los menús solo enumeran métricas para las cuales se recibieron datos. Se proporciona una opción para activar o desactivar la lista que te permite enumerar todas las métricas de Google Cloud.
El campo métricas identifica las medidas que se recopilarán de un recurso supervisado. En este, se incluye una descripción de lo que se mide y cómo se interpretan las mediciones. Métrica es una forma corta de tipo de métrica. Para obtener información conceptual, consulta Tipos de métricas.
En el campo Tipo de recurso, se especifica desde qué recurso se capturan los datos de la métrica. A veces, el tipo de recurso se denomina tipo de recurso supervisado o recurso. Para obtener información conceptual, consulta Recursos supervisados.
Para usar el modo predeterminado, haz lo siguiente:
- En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
Ir a Monitoring - En el panel de navegación, selecciona notifications Alertas.
- Haga clic en Crear política.
- Selecciona un recurso y una métrica mediante el menú Seleccionar una métrica.
- Agrega filtros, especifica la transformación de datos y completa el diálogo de la política de alertas. Para obtener más información, consulta Crea una política de alertas basada en métricas.
Modo MQL
Para usar el lenguaje de consulta de Monitoring (MQL) a fin de describir la condición o supervisar una proporción de métricas, usa [MQL].
Para usar MQL, haz lo siguiente:
- En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
Ir a Monitoring - En el panel de navegación, selecciona notifications Alertas.
- Haga clic en Crear política.
- En la barra de herramientas, selecciona MQL.
- Ingresa una expresión de MQL. Para obtener información sobre cómo usar MQL, consulta Usa el lenguaje de consulta de Monitoring.
- Completa el diálogo de la política de alertas. Para obtener más información, consulta Administra las políticas de alertas con MQL.
Modo de filtro directo
Cuando quieras realizar cualquiera de las siguientes acciones, usa el modo de filtro directo:
- Supervisar los objetivos de nivel de servicio (SLO)
- Configure una alerta para las métricas personalizadas de las que aún no tenga datos.
- Supervisar la cantidad de procesos que se ejecutan en las VM
- Verifica la sintaxis de una declaración de filtro para que se incluya en un comando de la API.
- Configura una alerta que especifique etiquetas de usuario para las que aún no tengas datos.
Cuando usas el modo de filtro directo, para seleccionar la serie temporal, ingresa un filtro de Monitoring. Por ejemplo, el siguiente filtro de Monitoring en el gráfico muestra un recuento de procesos cuyo nombre incluye nginx
:
select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
resource.type="gce_instance"
En el siguiente filtro, se selecciona la serie temporal Disk write bytes
para las VM de Compute Engine que se encuentran en la zona us-central1-a
:
metric.type="compute.googleapis.com/instance/disk/write_bytes_count"
resource.type="gce_instance"
resource.label."zone"="us-central1-a"
Para ingresar un filtro de supervisión o un selector de series temporales, haz lo siguiente:
- En Google Cloud Console, selecciona Monitoring o haz clic en el siguiente botón:
Ir a Monitoring - En el panel de navegación, selecciona notifications Alertas.
- Haga clic en Crear política.
- Selecciona ? En el encabezado de la sección Seleccionar métrica, selecciona Modo de filtro directo en la información sobre la herramienta.
Ingresa un filtro de supervisión o un selector de series temporales. Para obtener información sobre la sintaxis, consulta los siguientes documentos:
Especifica la transformación de datos y completa el cuadro de diálogo de la política de alertas. Para obtener más información, consulta Crea una política de alertas del estado del proceso.
Filtra los datos seleccionados
Puedes reducir la cantidad de datos que se supervisan si especificas los criterios del filtro o si aplicas la agregación. Los filtros garantizan que solo se usen series temporales que cumplan con un conjunto de criterios. Cuando aplicas filtros, hay menos series temporales para evaluar, lo que puede mejorar el rendimiento de la alerta.
Cuando proporcionas varios criterios de filtrado, el gráfico correspondiente muestra solo las series temporales que cumplen con todos los criterios, un AND
lógico.
Para agregar un filtro, haz clic en Agregar filtro, completa el cuadro de diálogo y, luego, haz clic en Listo. En el cuadro de diálogo, usa el campo Filtro para seleccionar el criterio que deseas filtrar. Por ejemplo, puedes filtrar por grupo de recursos, por nombre, por etiqueta de recurso, por zona y por etiqueta de métrica. Después de seleccionar el criterio del filtro, completa el filtro mediante la selección del operador de comparación y el valor. En cada fila de la siguiente tabla, se muestra un operador de comparación, su significado y un ejemplo:
Operador | Significado | Ejemplo |
---|---|---|
= |
Igualdad | resource.labels.zone = "us-central1-a |
!= |
Desigualdad | resource.labels.zone != "us-central1-a" |
=~ |
Igualdad de expresión regular 2 | monitoring.regex.full_match("^us.*") |
!=~ |
Desigualdad de expresión regular 2 | monitoring.regex.full_match("^us.*") |
starts_with |
El valor comienza con | resource.labels.zone = starts_with("us") |
ends_with |
El valor termina con | resource.labels.zone = ends_with("b") |
has_substring |
El valor contiene | resource.labels.zone = has_substring("east") |
one_of |
Uno de | resource.labels.zone = one_of("asia-east1-b", "europe-north1-a") |
!starts_with |
El valor no comienza con | resource.labels.zone != starts_with("us") |
!ends_with |
El valor no termina con | resource.labels.zone != ends_with("b") |
!has_substring |
El valor no contiene | resource.labels.zone != has_substring("east") |
!one_of |
El valor no es uno de | resource.labels.zone != one_of("asia-east1-b", "europe-north1-a") |
Transforma los datos
Después de seleccionar las series temporales, los siguientes pasos son especificar cómo se procesa cada una, también conocida como alineación, y cómo se combinan las series temporales alineadas.
En el resto de esta página, se describen brevemente estas opciones. Para obtener una explicación detallada, consulta Manipulación de series temporales.
Alinea series temporales
La alineación es el proceso de convertir los datos de la serie temporal recibidos por Monitoring en una nueva serie temporal con datos extraídos por un período fijo. El proceso de alineación está compuesto por los siguientes pasos:
- La división de una serie temporal en un conjunto de intervalos de longitud fija.
- La recopilación de todos los datos recibidos en cada intervalo y el aplicado de una función para combinar esos datos Por ejemplo, puedes seleccionar esta función para calcular el promedio de todas las muestras.
- Asocia una marca de tiempo con el valor calculado en el paso anterior y, luego, agrega el par a las series temporales alineadas.
Para obtener un análisis general de alineación, consulta Alineación: regularización dentro de la serie.
Cuando creas una condición en una política de alertas, debes especificar los parámetros de alineación. Si usas Google Cloud Console, se proporcionan los valores predeterminados para estos parámetros:
Ventana progresiva: este campo es un intervalo retrospectivo de un punto en el tiempo específico. Por ejemplo, si el valor es de cinco minutos, a la 1:00 p.m., las muestras recibidas entre las 12:55 p.m. y la 1:00 p.m. están alineadas. A la 1:01 p.m., las muestras recibidas entre las 12:56 p.m. y la 1:01 p.m. están alineadas. En el contexto de las políticas de alertas, el período de alineación se puede ver como una ventana deslizante que observa el pasado. Para ver un análisis más completo sobre este campo, consulta El período de alineación y la duración.
Función de ventana progresiva: El campo especifica la función que se usa para combinar todos los datos en el intervalo de retrospectiva. En la API de Cloud Monitoring, este campo se llama alinear. Para obtener más información sobre las funciones disponibles, consulta
Aligner
en la referencia de la API. Algunas de las funciones de alineación alinean los datos y los convierten de una categoría o tipo de métrica a otro. Para obtener una explicación detallada, consulta Clases, tipos y conversiones.
Combina series temporales
Puedes reducir la cantidad de datos que se muestran de una métrica si combinas diferentes series temporales. Para combinar varias series temporales, por lo general, debes especificar una agrupación y una función. La agrupación se realiza mediante valores de etiqueta. La función define cómo se combinan todos los datos de series temporales de un grupo en una nueva serie temporal.
Para acceder a las opciones de combinación de series temporales, haz clic en expand_more Mostrar más en la sección Serie temporal.
Para combinar series temporales por valor de etiqueta, haz clic en el texto Grupo de series temporales por y selecciona el menú. El menú se construye de forma dinámica según la serie temporal que seleccionaste.
Cuando agregas la primera etiqueta, ocurre lo siguiente:
Se muestra un error porque el campo Agregación de serie temporal está configurado como ninguno. Para resolver el error, selecciona una función que se use para combinar las series temporales con el mismo valor de etiqueta.
El gráfico muestra una serie temporal para cada valor de la etiqueta que aparece en el campo Grupo de series temporales por.
Si no especificas una opción de agrupación y especificas una función de agregación, esa función se aplica a la serie temporal seleccionada y genera una sola serie temporal.
Puedes agrupar por varias etiquetas. Cuando tienes varias opciones de agrupación, el agregador se aplica al conjunto de series temporales que tienen los mismos valores para las etiquetas seleccionadas.
En el gráfico resultante, se muestra una serie temporal para cada combinación de valores de etiqueta. No importa el orden en que especifiques las etiquetas.
Por ejemplo, en la siguiente captura de pantalla, se muestra la agrupación por user_labels.version
y por system_labels.machine_image
:
Como se ilustra, si agrupas mediante ambas etiquetas, obtienes una serie temporal para cada par de valores. El hecho de que obtengas una serie temporal por cada combinación de etiquetas significa que esta técnica puede crear fácilmente más datos de los que puedes utilizar en un solo gráfico.
Cuando especificas la agrupación o si seleccionas un agregador, la serie temporal representada solo contiene las etiquetas obligatorias, como el identificador del proyecto, y las etiquetas que especifica la agrupación.
Para quitar un grupo por condición, debes hacer lo siguiente:
- Quita las etiquetas agrupadas.
- Configura el agregador como
none
.
Agregación secundaria
Si se muestran varias series temporales después de la Transformación de datos principal y si deseas que la política de alertas supervise una sola serie temporal, usa los campos Transformación de datos secundarios.
Comportamiento cuando faltan datos
Consola de Google Cloud
Puedes configurar cómo Monitoring evalúa una condición de límite de métrica cuando los datos dejan de llegar. Por ejemplo, cuando un incidente está abierto y no llega una medición esperada, ¿quieres que Monitoring deje el incidente abierto o lo cierre de inmediato? Del mismo modo, cuando los datos dejan de llegar y no hay un incidente abierto, ¿quieres que se abra un incidente? Por último, ¿cuánto tiempo debe permanecer abierto un incidente después de que dejan de llegar los datos?
Hay dos campos configurables que especifican cómo evalúa Monitoring las condiciones del límite de métrica cuando los datos dejan de llegar:
Para configurar la forma en que Monitoring determina el valor de reemplazo de datos faltantes, usa el campo Evaluación de datos faltantes que estableces en el paso Activador de condición. Este campo se inhabilita cuando la ventana de prueba nueva se establece como Sin nueva prueba.
Para configurar cuánto tiempo espera Monitoring antes de cerrar un incidente abierto después de que dejan de llegar los datos, usa el campo Duración del cierre automático de incidentes. Establece la duración del cierre automático en el paso Notificación. La duración predeterminada del cierre automático es de siete días.
A continuación, se describen las diferentes opciones para el campo de datos faltantes:
Google Cloud Console Campo “Evaluación de datos faltantes” |
Resumen | Detalles |
---|---|---|
Faltan datos | Los incidentes abiertos permanecen abiertos. No se abren incidentes nuevos. |
Para las condiciones que se cumplen, la condición aún se cumple cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando se abre un incidente y no llegan datos, el temporizador de cierre automático comienza después de un retraso de al menos 15 minutos. Si se vence el temporizador, se cierra el incidente. Para las condiciones que no se cumplen, la condición aún no se cumple cuando los datos dejan de llegar. |
Datos faltantes que se consideran valores que infringen la condición de la política | Los incidentes abiertos permanecen abiertos. Se pueden abrir incidentes nuevos. |
Para las condiciones que se cumplen, la condición aún se cumple cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos para la duración del cierre automático más 24 horas, el incidente se cierra. En el caso de las condiciones que no se cumplan, esta configuración hace que la condición del umbral de métrica se comporte como un |
Datos faltantes tratados como valores que no infringen la condición de la política | Los incidentes abiertos están cerrados. No se abren incidentes nuevos. |
Para las condiciones que se cumplen, la condición deja de cumplirse cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente se cierra. Para las condiciones que no se cumplen, la condición aún no se cumple cuando los datos dejan de llegar. |
API
Puedes configurar cómo Monitoring evalúa una condición de límite de métrica cuando los datos dejan de llegar. Por ejemplo, cuando un incidente está abierto y no llega una medición esperada, ¿quieres que Monitoring deje el incidente abierto o lo cierre de inmediato? Del mismo modo, cuando los datos dejan de llegar y no hay un incidente abierto, ¿quieres que se abra un incidente? Por último, ¿cuánto tiempo debe permanecer abierto un incidente después de que dejan de llegar los datos?
Hay dos campos configurables que especifican cómo evalúa Monitoring las condiciones del límite de métrica cuando los datos dejan de llegar:
Para configurar la forma en que Monitoring determina el valor de reemplazo de los datos faltantes, usa el campo
evaluationMissingData
de la estructuraMetricThreshold
. Este campo se ignora cuando el campoduration
es cero.Para configurar cuánto tiempo espera Monitoring antes de cerrar un incidente abierto después de que dejan de llegar los datos, usa el campo
autoClose
en la estructuraAlertStrategy
.
A continuación, se describen las diferentes opciones para el campo de datos faltantes:
API Campo evaluationMissingData |
Resumen | Detalles |
---|---|---|
EVALUATION_MISSING_DATA_UNSPECIFIED |
Los incidentes abiertos permanecen abiertos. No se abren incidentes nuevos. |
Para las condiciones que se cumplen, la condición aún se cumple cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando se abre un incidente y no llegan datos, el temporizador de cierre automático comienza después de un retraso de al menos 15 minutos. Si se vence el temporizador, se cierra el incidente. Para las condiciones que no se cumplen, la condición aún no se cumple cuando los datos dejan de llegar. |
EVALUATION_MISSING_DATA_ACTIVE |
Los incidentes abiertos permanecen abiertos. Se pueden abrir incidentes nuevos. |
Para las condiciones que se cumplen, la condición aún se cumple cuando los datos dejan de llegar. Si un incidente está abierto para esta condición, el incidente permanece abierto. Cuando un incidente está abierto y no llegan datos para la duración del cierre automático más 24 horas, el incidente se cierra. En el caso de las condiciones que no se cumplan, esta configuración hace que la condición del umbral de métrica se comporte como un |
EVALUATION_MISSING_DATA_INACTIVE |
Los incidentes abiertos están cerrados. No se abren incidentes nuevos. |
Para las condiciones que se cumplen, la condición deja de cumplirse cuando los datos dejan de llegar. Si hay un incidente abierto para esta condición, el incidente se cierra. Para las condiciones que no se cumplen, la condición aún no se cumple cuando los datos dejan de llegar. |