Las alertas permiten el conocimiento oportuno de los problemas en tus aplicaciones de nube, a fin de que puedas resolverlos rápidamente. En Cloud Monitoring, una política de alertas describe las circunstancias en las que deseas recibir la alerta y cómo quieres ser notificado. En esta página, se proporciona una descripción general de las políticas de alertas.
Las políticas de alertas que se usan para hacer un seguimiento de los datos de métricas que recopila Cloud Monitoring se llaman políticas de alertas basadas en métricas. En la mayor parte de la documentación de Cloud Monitoring sobre las políticas de alertas, se supone que usas políticas de alertas basadas en métricas. Si deseas obtener información sobre cómo configurar una política de alertas basada en métricas, prueba la Guía de inicio rápido para Compute Engine.
También puedes crear políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en los registros. Estas políticas no se basan en métricas. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.
Cómo funcionan las alertas
Cada política de alertas especifica lo siguiente:
Condiciones que describen cuándo un recurso, o un grupo de recursos, se encuentra en un estado que requiere que respondas. Por ejemplo, puedes configurar una condición de la siguiente manera:
The HTTP response latency is higher than two seconds for at least five minutes.
En este ejemplo, la condición supervisa la métrica latencia de respuesta HTTP y se activa cuando todas las mediciones de latencia en un período de cinco minutos son superiores a dos segundos.
Existen tres tipos de condiciones:
- Las condiciones del umbral de métricas se activan cuando los valores de una métrica son mayores o menores que un umbral para un período de duración específico.
- Las condiciones de ausencia de la métrica se activan cuando no hay mediciones para un período de duración.
- Las condiciones de previsión predicen el comportamiento futuro de las mediciones mediante datos anteriores. Estas condiciones se activan cuando hay una predicción de que una serie temporal infringirá el umbral dentro de una ventana de previsión.
Una política de alertas debe tener al menos una condición. Sin embargo, puedes configurar una política para que contenga varias condiciones.
Canales de notificaciones que describen quién recibirá la notificación cuando se requiera una acción. Puedes incluir varios canales de notificaciones en una política de alertas. Cloud Monitoring es compatible con Cloud Mobile App y Pub/Sub, además de los canales de notificaciones comunes. Para obtener una lista completa de los canales admitidos y su información para configurar estos canales, consulta Cómo crear y administrar canales de notificaciones.
Por ejemplo, puedes configurar una política de alertas para enviar un correo electrónico a
my-support-team@example.com
y publicar un mensaje de Slack en el canal#my-support-team
.Documentación que deseas incluir en una notificación. El campo de documentación admite texto sin formato, Markdown y variables.
Por ejemplo, puedes incluir en tu política de alertas la siguiente documentación:
## HTTP latency responses This alert originated from the project ${project}, using the variable $${project}.
Después de configurar una política de alertas basada en métricas, Monitoring supervisa de forma continua las condiciones de esa política. No puedes configurar las condiciones que se supervisarán solo para ciertos períodos.
Cuando las condiciones de un activador de política de alertas, Monitoring crea un incidente y envía una notificación sobre la creación del incidente. Esta notificación incluye información resumida sobre el incidente, un vínculo a la página Detalles de la política para que puedas investigar el incidente y cualquier documentación. que especificaste.
Si un incidente está abierto y Monitoring determina que las condiciones de la política basada en métricas ya no se cumplen, Monitoring cierra automáticamente el incidente y envía una notificación sobre el cierre.
Ejemplo
Implementas una aplicación web en una instancia de máquina virtual (VM) de Compute Engine que ejecuta una aplicación web. Si bien esperas que la latencia de respuesta de HTTP fluctúe, deseas que el equipo de asistencia responda cuando la aplicación tiene una latencia alta durante un período significativo.
Para asegurarte de que se notifique al equipo de asistencia cuando la aplicación experimente latencias altas, crea la siguiente política de alertas:
If the HTTP response latency is higher than two seconds for at least five minutes, then open an incident and send an email to your support team.
En esta política de alertas, la condición del umbral de métricas supervisa la latencia de respuesta HTTP. Si esta latencia es mayor que dos segundos de forma continua durante cinco minutos, se activa la condición y se crea un incidente. Un pico transitorio en la latencia no hace que se active la condición ni se cree un incidente.
Tu aplicación web resulta ser popular, y la latencia de la respuesta aumenta más de dos segundos. Tu política de alertas responde de la siguiente manera:
Monitoring inicia un temporizador de cinco minutos cuando recibe una medición de latencia HTTP superior a dos segundos.
Si cada medición de latencia recibida durante los siguientes cinco minutos es superior a dos segundos, el temporizador se vence. Cuando vence el temporizador, la condición se activa, y Monitoring abre un incidente y envía un correo electrónico a tu equipo de asistencia al cliente.
Tu equipo de asistencia recibe el correo electrónico, accede a Google Cloud Console y confirma la recepción de la notificación.
Con la documentación del correo electrónico de notificación, tu equipo de asistencia puede abordar la causa de la latencia. En unos minutos, la latencia de la respuesta HTTP disminuye a menos de dos segundos.
Cuando Monitoring recibe una medición de latencia HTTP inferior a dos segundos, se cierra el incidente y se envía una notificación al equipo de asistencia al cliente para informarle que se cerró el incidente.
Si la latencia aumenta a más de dos segundos y se mantiene por encima de ese umbral durante cinco minutos, se abre un nuevo incidente y se envía una notificación.
Cómo agregar una política de alertas
Puedes agregar una política de alertas basada en métricas a tu proyecto de Google Cloud mediante la consola de Google Cloud, la API de Cloud Monitoring o Google Cloud CLI:
Cuando usas Google Cloud Console, puedes habilitar una alerta recomendada o crear una alerta desde la página Alertas de Cloud Monitoring.
Las alertas recomendadas están disponibles para algunos productos de Google Cloud. Estas alertas requieren una configuración mínima, como la adición de canales de notificación. Por ejemplo, la página Temas de Pub/Sub Lite vincula a las alertas que están configuradas para notificarte cuando alcances un límite de cuota. De manera similar, la página Instancias de VM desde Monitoring vincula a las políticas de alertas configuradas para supervisar el uso de memoria y la latencia de red de esas instancias.
Para obtener información sobre cómo crear una política de alertas, consulta los siguientes documentos:
- Crea políticas de alertas de umbral de métrica
- Crea políticas de alertas de ausencia de métricas
- Crea políticas de alertas de valores de métricas previstas
Cualquier política que crees mediante la consola de Google Cloud también puede modificarse y verse con la consola de Google Cloud o la API de Cloud Monitoring. La API de Cloud Monitoring te permite crear políticas de alertas que supervisan las proporciones de las métricas. Cuando estas políticas usan filtros de Monitoring, no puedes verlas ni modificarlas mediante la consola de Google Cloud.
Cuando usas la API de Cloud Monitoring directamente o cuando usas Google Cloud CLI, puedes crear, ver y modificar políticas de alertas.
Para obtener más información, consulta Crea políticas de alertas mediante la API de Cloud Monitoring o Google Cloud CLI.
Puedes crear condiciones que supervisen una sola métrica, varias métricas o una proporción de ellas. Cuando usas la API de Cloud Monitoring, puedes especificar la proporción mediante el uso del lenguaje de consulta de Monitoring (MQL) o mediante filtros de Monitoring. Para obtener un ejemplo de una política que usa filtros de Monitoring, consulta Proporción de métricas.
Cloud Monitoring es compatible con un lenguaje expresivo y basado en texto que se puede usar con la consola de Google Cloud y la API de Cloud Monitoring. Para obtener información sobre el uso de este lenguaje con alertas, consulta Crea políticas de alertas mediante el lenguaje de consulta de Monitoring (MQL).
Puedes agregar una política de alertas basada en registros a tu proyecto de Google Cloud mediante el Explorador de registros en Cloud Logging o mediante la API de Monitoring. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.
Costos asociados con las políticas de alertas
No hay costos asociados al uso de políticas de alertas. Para obtener información sobre los precios de las verificaciones de tiempo de actividad, consulta Resumen de precios de Cloud Monitoring.
Se aplican los siguientes límites al uso de las políticas de alertas y las verificaciones de tiempo de actividad:
Categoría | Valor | Tipo de política1 |
---|---|---|
Políticas de alertas (suma del registro y la métrica) por alcance de métricas 2 | 500 | Métrica, registro |
Condiciones por política de alertas | 6 | Métrica |
Período máximo que una condición de ausencia de métricas evalúa3 |
1 día | Métrica |
Período máximo que una condición de umbral de métrica evalúa3 |
23 horas y 30 minutos | Métrica |
Longitud máxima del filtro que se usó en una condición de umbral de métrica |
2,048 caracteres Unicode | Métrica |
Cantidad máxima de series temporales supervisadas por una condición de previsión |
64 | Métrica |
Ventana de previsión mínima | 1 hora (3,600 segundos) | Métrica |
Ventana de previsión máxima | 7 días (604,800 segundos) | Métrica |
Canales de notificaciones por política de alertas | 16 | Métrica, registro |
Frecuencia máxima de notificaciones | 1 notificación cada 5 minutos por cada alerta basada en registros | Registro |
Cantidad máxima de notificaciones | 20 notificaciones por día por cada alerta basada en registros | Registro |
Cantidad máxima de incidentes abiertos simultáneamente por política de alertas |
1,000 | Métrica |
Período después del cual se cierra automáticamente un incidente sin datos nuevos |
7 días | Métrica |
Duración máxima de un incidente si no se cierra de forma manual | 7 días | Registro |
Retención de incidentes cerrados | 13 meses | No aplicable |
Retención de incidentes abiertos | Indefinido | No aplicable |
Canales de notificaciones por alcance de métricas | 4,000 | No aplicable |
Cantidad máxima de políticas de alertas por alerta pospuesta | 16 | Métrica, registro |
Retención de una alerta pospuesta | 13 meses | No aplicable |
Verificaciones de tiempo de actividad por alcance de métricas 4 | 100 | No aplicable |
Cantidad máxima de pings de ICMP por verificación de tiempo de actividad pública | 3 | No aplicable |
2Apigee y Apigee Hybrid están profundamente integrados en Cloud Monitoring. El límite de alertas para todos los niveles de suscripción de Apigee (Standard, Enterprise y Enterprise Plus) es el mismo que para Cloud Monitoring: 500 por alcance de métrica.
3El período máximo que una condición evalúa es la suma del período de alineación y los valores del período de duración. Por ejemplo, si el período de alineación se establece en 15 horas y el período de duración se establece en 15 horas, se requieren 30 horas de datos para evaluar la condición.
4Se aplica este límite a la cantidad de configuraciones de verificación de tiempo de actividad. Cada configuración incluye el intervalo de tiempo entre la prueba del estado del recurso especificado. Consulta Administra verificaciones de tiempo de actividad para obtener más información.
Para obtener información detallada sobre los precios, consulta Precios de Google Cloud's operations suite.
¿Qué sigue?
Para obtener información sobre la latencia de las notificaciones y cómo las elecciones de los parámetros de una política de alertas afectan cuándo se envían las notificaciones, consulta Comportamiento de las políticas de alertas basadas en métricas.
Para obtener una lista de ejemplos de políticas basadas en métricas, consulta Resumen de políticas de alertas de ejemplo.
Para obtener información sobre cómo supervisar la cantidad de intervalos o registros de seguimiento que se transfieren o cómo recibir notificaciones cuando se incluye contenido específico en una entrada de registro, consulta lo siguiente: