Introducción a las alertas

Las alertas permiten el conocimiento oportuno de los problemas en tus aplicaciones de nube, a fin de que puedas resolverlos rápidamente.

En Cloud Monitoring, una política de alertas describe las circunstancias en las que deseas recibir alertas y cómo deseas recibir las notificaciones. En esta página, se proporciona una descripción general de las políticas de alertas.

Las políticas de alertas que se usan para realizar un seguimiento de los datos de métrica recopilados por Cloud Monitoring se llaman políticas de alertas basadas en métricas. En la mayor parte de la documentación de Cloud Monitoring sobre las políticas de alertas, se supone que usas políticas de alertas basadas en métricas. Si quieres aprender a configurar una política de alertas basada en métricas, consulta la Guía de inicio rápido para Compute Engine.

También puedes crear políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje específico en tus registros. Estas políticas no se basan en métricas. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.

Cómo funcionan las alertas

Cada política de alertas especifica lo siguiente:

  • Las condiciones que describen cuándo un recurso, o un grupo o recursos, están en un estado que requiere que tomes medidas. Una política de alertas debe tener al menos una condición. Sin embargo, puedes configurar una política para que contenga varias condiciones.

    Por ejemplo, puedes configurar una condición de la siguiente manera:

    The HTTP response latency is higher than two seconds for at least five minutes.
    

    En este ejemplo, la condición supervisa la métrica latencia de respuesta HTTP y especifica cuándo los valores de la métrica requieren que tomes medidas.

  • Canales de notificaciones que describen quién debe recibir una notificación cuando se requiere una acción Puedes incluir varios canales de notificaciones en una política de alertas. Cloud Monitoring es compatible con los canales de notificaciones comunes, además de Cloud Mobile App y Pub/Sub. Para obtener una lista completa de los canales compatibles y la información sobre cómo configurar estos canales, consulta Opciones de notificación.

    Por ejemplo, puedes configurar una política de alertas para enviar un correo electrónico a my-support-team@example.com y publicar un mensaje de Slack en el canal #my-support-team.

  • Documentación que deseas incluir en una notificación El campo de documentación admite texto sin formato, markdown y variables.

    Por ejemplo, puedes incluir la siguiente documentación en tu política de alertas:

    ## HTTP latency responses
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

Después de configurar una política de alertas basada en métricas, Monitoring supervisa de forma continua las condiciones de esa política. No puedes configurar las condiciones que se supervisarán solo para ciertos períodos. Cuando se cumplen las condiciones de esa política, es decir, cuando el estado de los recursos requiere que tomes medidas, Monitoring crea un incidente y envía una notificación sobre el incidente. creación. Esta notificación incluye información resumida sobre el incidente, un vínculo a la página Detalles de la política para que puedas investigar el incidente y cualquier documentación. que especificaste.

Si un incidente está abierto y Monitoring determina que ya no se cumplen las condiciones de la política basada en métricas, Monitoring cierra el incidente de forma automática y envía una notificación sobre el cierre.

Ejemplo

Implementas una aplicación web en una instancia de máquina virtual (VM) de Compute Engine que ejecuta una aplicación web. Si bien sabes que la latencia de la respuesta HTTP puede fluctuar a medida que la demanda aumenta o disminuye con normalidad, si tus usuarios comienzan a experimentar una latencia alta durante un período considerable, querrás recibir una notificación para que la asistencia puede tomar medidas.

Para recibir una notificación cuando los usuarios experimentan una latencia alta, crea la siguiente política de alertas:

  If the HTTP response latency is higher than two seconds for at least five minutes,
  then open an incident and send an email to your support team.

En esta política de alertas, la condición supervisa la latencia de respuesta HTTP. Si esta latencia es superior a dos segundos de forma continua durante cinco minutos, se cumple la condición y se crea un incidente. Un pico transitorio de latencia no hace que se cumpla la condición ni se cree un incidente.

Tu aplicación web es muy popular y la latencia de respuesta aumenta más de dos segundos. Tu política de alertas responde de la siguiente manera:

  1. Monitoring inicia un temporizador de cinco minutos cuando recibe una medición de latencia de HTTP mayor que dos segundos.

  2. Si cada medida de latencia recibida durante los siguientes cinco minutos es mayor que dos segundos, entonces el temporizador caduca. Cuando vence el temporizador, Monitoring marca la condición como cumplir, abre un incidente y envía un correo electrónico a tu equipo de asistencia.

  3. Tu equipo de asistencia recibe el correo electrónico, accede a Cloud Console y confirma la recepción de la notificación.

  4. Según la documentación del correo electrónico de notificación, tu equipo de asistencia al cliente puede abordar la causa de la latencia. En pocos minutos, la latencia de la respuesta HTTP disminuye a menos de dos segundos.

  5. Cuando Monitoring recibe una medición de latencia de HTTP por debajo de los dos segundos, cierra el incidente y envía una notificación a tu equipo de asistencia para informar que el incidente está cerrado.

Después de que se cierra el incidente, si la latencia de la respuesta HTTP aumenta más de dos segundos y se mantiene por encima de ese umbral de forma continua durante cinco minutos, Monitoring abre un nuevo incidente y envía un correo electrónico de notificación.

Cómo agregar una política de alertas

Puedes agregar una política de alertas basada en métricas a tu proyecto de Google Cloud mediante Google Cloud Console, la API de Cloud Monitoring o el SDK de Cloud:

  • Si usas Cloud Console, puedes habilitar una alerta recomendada o crear una desde la página Alertas de Cloud Monitoring.

    Las alertas recomendadas están disponibles para algunos productos de Google Cloud. Estas alertas requieren una configuración mínima, como agregar canales de notificaciones. Por ejemplo, si estás viendo la página Temas de Pub/Sub Lite, puedes habilitar una alerta para que te notifique si estás alcanzando un límite de cuota. De manera similar, si ves la página Instancias de VM desde Monitoring, puedes habilitar las políticas de alertas recomendadas que supervisan el uso de memoria y la latencia de red de esas instancias.

    Para obtener información sobre cómo crear una política de alertas cuando se inicia en la página Alertas de Cloud Monitoring, consulta Crea políticas de alertas con Cloud Console.

  • Si usas la API de Cloud Monitoring directamente o si usas el SDK de Cloud, puedes crear, ver y modificar políticas de alertas. Si deseas que la condición de una política de alertas calcule la proporción de dos métricas y, luego, compare esa proporción con un umbral, debes crear esa política mediante la API de Cloud Monitoring o el SDK de Cloud. , Para ver un ejemplo de este tipo de política, consulta Proporción de métrica.

    Para obtener más información sobre cómo usar la API de Cloud Monitoring y el SDK de Cloud, consulta Crea políticas de alertas mediante la API de Cloud Monitoring o el SDK de Cloud.

Cloud Monitoring es compatible con un lenguaje expresivo basado en texto que se puede usar con Google Cloud Console y con la API de Cloud Monitoring. Para obtener información sobre el uso de este lenguaje con alertas, consulta Crea políticas de alertas con el lenguaje de consulta de Monitoring (MQL).

Puedes agregar una política de alertas basadas en registros al proyecto de Google Cloud mediante el Explorador de registros en Cloud Logging o mediante la API de Monitoring. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.

Cómo administrar las políticas de alertas

Para obtener información sobre cómo ver una lista de las políticas de alertas basadas en métricas de tu proyecto y cómo modificar esas políticas, consulta los siguientes vínculos:

Para obtener información sobre cómo administrar las políticas de alertas basadas en registros, consulta Usa alertas basadas en registros.

Se requiere autorización para crear políticas de alertas

En esta sección, se describen las funciones o los permisos necesarios para crear una política de alertas. A fin de obtener información detallada sobre la administración de identidades y accesos (IAM) para Cloud Monitoring, consulta Control de acceso.

Cada función de IAM tiene un ID y un nombre. Los ID de las funciones tienen el formato roles/monitoring.editor y se pasan como argumentos a la herramienta de línea de comandos de gcloud cuando configuras el control de acceso. Para obtener más información, consulta Cómo otorgar, cambiar y revocar el acceso a los recursos. Cloud Console muestra los nombres de las funciones, como editor de Monitoring.

Funciones de Cloud Console requeridas

A fin de crear una política de alertas, el nombre de tu función de IAM para el proyecto de Google Cloud debe ser uno de los siguientes:

  • Editor de Monitoring
  • Administrador de Monitoring
  • Propietario del proyecto

Para ver una lista de las funciones y sus permisos asociados, consulta Funciones.

Permisos de API necesarios

Si deseas usar la API de Cloud Monitoring a fin de crear una política de alertas, tu ID de función de IAM para el proyecto de Google Cloud debe ser uno de los siguientes:

  • roles/monitoring.alertPolicyEditor: Este ID de función otorga los permisos mínimos que se necesitan para crear una política de alertas. Para obtener más detalles sobre esta función, consulta Funciones de alertas predefinidas.
  • role/monitoring.editor
  • role/monitoring.admin
  • role/owner

A fin de identificar el permiso necesario para un método específico de la API de Cloud Monitoring, consulta Permisos de la API de Cloud Monitoring. Para ver una lista de las funciones y sus permisos asociados, consulta Funciones.

Determina tu función

Para determinar tu función en un proyecto con Cloud Console, haz lo siguiente:

  1. Abre Cloud Console y selecciona el proyecto de Google Cloud:

    Ir a Cloud Console

  2. Para ver tu función, haz clic en IAM y administrador. Tu función está en la misma línea que tu nombre de usuario.

Para determinar tus permisos a nivel de la organización, comunícate con el administrador de la organización.

Costos asociados con las políticas de alertas

No hay costos asociados con el uso de políticas de alertas o verificaciones de tiempo de actividad, pero se aplican los siguientes límites:

Categoría Valor Tipo de política1
Políticas de alertas (suma de la métrica y el registro) por alcance de las métricas 2 500 Métrica, registro
Condiciones por política de alertas 6 Métrica
Período máximo que evalúa una
condición de ausencia de métricas3
1 día Métrica
Período máximo que evalúa una
condición de umbral de métrica3
23 horas y 30 minutos Métrica
Canales de notificaciones por política de alertas 16 Métrica, registro
Frecuencia máxima de notificaciones 1 notificación cada 5 minutos por cada alerta basada en registros Registro
Cantidad máxima de notificaciones 20 notificaciones diarias para cada alerta basada en registros Registro
Cantidad máxima de incidentes abiertos simultáneamente
por política de alertas
5000 Métrica
Período después del cual se cierra automáticamente un incidente sin datos nuevos
7 días Métrica
Duración máxima de un incidente si no se cierra de forma manual 7 días Registro
Retención de incidentes cerrados 90 días No aplicable
Retención de incidentes abiertos Indefinido No aplicable
Canales de notificaciones por alcance de métricas 4000 No aplicable
Verificaciones de tiempo de actividad por alcance de métricas 4 100 No aplicable
1 Métrica: Una política de alertas basada en datos de métricas. Registro: una política de alertas basada en mensajes de registro (alertas basadas en registros)
2Apigee y Apigee Hybrid están profundamente integradas en Cloud Monitoring. El límite de alertas para todos los niveles de suscripción de Apigee (Standard, Enterprise y Enterprise Plus) es el mismo que el de Cloud Monitoring: 500 por permiso de las métricas .
3El período máximo que evalúa una condición es la suma del período de alineación y los valores del período de duración. Por ejemplo, si el período de alineación se establece en 15 horas y el período de duración se establece en 15 horas, se requieren 30 horas de datos para evaluar la condición.
4 Este límite se aplica a la cantidad de configuraciones de verificación de tiempo de actividad. Cada configuración incluye el intervalo de tiempo entre la prueba del estado del recurso especificado. Consulta Administra verificaciones de tiempo de actividad para obtener más información.

Para obtener información detallada sobre los precios, consulta Precios de Google Cloud's operations suite.

¿Qué sigue?