Introducción a las alertas

Las alertas permiten el conocimiento oportuno de los problemas en tus aplicaciones de nube, a fin de que puedas resolverlos rápidamente.

En Cloud Monitoring, una política de alertas describe las circunstancias en las que deseas recibir la alerta y cómo quieres ser notificado. En esta página, se proporciona una descripción general de las políticas de alertas.

Las políticas de alertas que se usan para hacer un seguimiento de los datos de métricas que recopila Cloud Monitoring se llaman políticas de alertas basadas en métricas. En la mayor parte de la documentación de Cloud Monitoring sobre las políticas de alertas, se supone que usas políticas de alertas basadas en métricas. Si deseas obtener información sobre cómo configurar una política de alertas basada en métricas, prueba la Guía de inicio rápido para Compute Engine.

También puedes crear políticas de alertas basadas en registros, que te notifican cuando aparece un mensaje en particular en los registros. Estas políticas no se basan en métricas. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.

Cómo funcionan las alertas

Cada política de alertas especifica lo siguiente:

  • Las condiciones que describen cuándo un recurso, o un grupo de recursos, se encuentra en un estado que requiere que respondas. Una política de alertas debe tener al menos una condición. Sin embargo, puedes configurar una política para que contenga varias condiciones.

    Por ejemplo, puedes configurar una condición de la siguiente manera:

    The HTTP response latency is higher than two seconds for at least five minutes.
    

    En este ejemplo, la condición supervisa la métrica latencia de respuesta HTTP y especifica cuándo los valores de la métrica requieren que respondas. La condición se cumple cuando el recurso, o el grupo de recursos, se encuentra en un estado que requiere que respondas.

  • Canales de notificaciones que describen quién recibirá la notificación cuando se requiera una acción. Puedes incluir varios canales de notificaciones en una política de alertas. Cloud Monitoring es compatible con Cloud Mobile App y Pub/Sub, además de los canales de notificaciones comunes. Para obtener una lista completa de los canales compatibles y la información sobre cómo configurar estos canales, consulta Opciones de notificación.

    Por ejemplo, puedes configurar una política de alertas para enviar un correo electrónico a my-support-team@example.com y publicar un mensaje de Slack en el canal #my-support-team.

  • Documentación que deseas incluir en una notificación. El campo de documentación admite texto sin formato, Markdown y variables.

    Por ejemplo, puedes incluir en tu política de alertas la siguiente documentación:

    ## HTTP latency responses
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

Después de configurar una política de alertas basada en métricas, Monitoring supervisa de forma continua las condiciones de esa política. No puedes configurar las condiciones que se supervisarán solo para ciertos períodos.

Cuando se cumplen las condiciones de esa política, Monitoring crea un incidente y envía una notificación sobre la creación del incidente. Esta notificación incluye información resumida sobre el incidente, un vínculo a la página Detalles de la política para que puedas investigar el incidente y cualquier documentación. que especificaste.

Si un incidente está abierto y Monitoring determina que las condiciones de la política basada en métricas ya no se cumplen, Monitoring cierra automáticamente el incidente y envía una notificación sobre el cierre.

Ejemplo

Implementas una aplicación web en una instancia de máquina virtual (VM) de Compute Engine que ejecuta una aplicación web. Si bien esperas que la latencia de la respuesta HTTP varíe, quieres que el equipo de asistencia al cliente responda cuando la aplicación tenga una latencia alta durante un período significativo.

Para asegurarte de que tu equipo de asistencia reciba una notificación cuando la aplicación experimente latencias altas, crea la siguiente política de alertas:

  If the HTTP response latency is higher than two seconds for at least five
  minutes, then open an incident and send an email to your support team.

En esta política de alertas, la condición supervisa la latencia de la respuesta HTTP. Si esta latencia es superior a dos segundos de forma continua durante cinco minutos, se cumple la condición y se crea un incidente. Un aumento transitorio de la latencia no hace que se cumpla la condición ni se cree un incidente.

Tu aplicación web es popular y la latencia de la respuesta crece más de dos segundos. Tu política de alertas responde de la siguiente manera:

  1. Monitoring inicia un temporizador de cinco minutos cuando recibe una medición de latencia de HTTP mayor que dos segundos.

  2. Si cada medición de latencia recibida durante los siguientes cinco minutos es superior a dos segundos, el temporizador se vence. Cuando el temporizador se vence, Monitoring marca la condición como cumplida, abre un incidente y envía un correo electrónico a tu equipo de asistencia.

  3. El equipo de asistencia recibe el correo electrónico, accede a Cloud Console y confirma que recibió la notificación.

  4. Con la documentación del correo electrónico de notificación, tu equipo de asistencia puede abordar la causa de la latencia. En pocos minutos, la latencia de la respuesta HTTP disminuye a menos de dos segundos.

  5. Cuando Monitoring recibe una medición de latencia de HTTP de menos de dos segundos, cierra el incidente y envía una notificación a tu equipo de asistencia al cliente para informarle que el incidente se cerró.

Si la latencia aumenta a más de dos segundos y se mantiene por encima de ese límite durante cinco minutos, se abre un nuevo incidente y se envía una notificación.

Cómo agregar una política de alertas

Puedes agregar una política de alertas basada en métricas a tu proyecto de Google Cloud con Google Cloud Console, la API de Cloud Monitoring o el SDK de Cloud:

  • Cuando usas Cloud Console, puedes habilitar una alerta recomendada o crear una alerta desde la página Alertas de Cloud Monitoring.

    Las alertas recomendadas están disponibles para algunos productos de Google Cloud. Estas alertas requieren una configuración mínima, como la adición de canales de notificación. Por ejemplo, la página Temas de Pub/Sub Lite contiene vínculos a alertas que están configuradas para notificarte cuando alcanzas un límite de cuota. De manera similar, la página Instancias de VM desde Monitoring se vincula a las políticas de alertas configuradas para supervisar el uso de memoria y la latencia de red de esas instancias.

    Cualquier política que crees mediante Cloud Console también puedes modificar y visualizar mediante Cloud Console o la API de Cloud Monitoring. La API de Cloud Monitoring te permite crear políticas de alertas que supervisen las proporciones de las métricas. Cuando estas políticas usan filtros de Monitoring, no puedes verlas ni modificarlas con Cloud Console.

    Para obtener información sobre cómo crear una política de alertas cuando comienzas en la página Alertas de Cloud Monitoring, consulta Crea políticas de alertas mediante Cloud Console.

  • Cuando usas la API de Cloud Monitoring directamente o el SDK de Cloud, puedes crear, ver y modificar políticas de alertas. Puedes crear condiciones que supervisen una proporción de métricas mediante la API de Cloud Monitoring o el SDK de Cloud. Cuando usas la API de Cloud Monitoring, puedes especificar la proporción mediante el lenguaje de consultas de Monitoring (MQL) o los filtros de Monitoring. Para ver un ejemplo de una política que usa filtros de Monitoring, consulta Proporción de métricas.

    Para obtener más información sobre el uso de la API de Cloud Monitoring y el SDK de Cloud, consulta Crea políticas de alertas mediante la API de Cloud Monitoring o el SDK de Cloud.

Cloud Monitoring es compatible con un lenguaje expresivo basado en texto que se puede usar con Google Cloud Console y con la API de Cloud Monitoring. Para obtener información sobre el uso de este lenguaje con alertas, consulta Crea políticas de alertas mediante el lenguaje de consulta de Monitoring (MQL).

Puedes agregar una política de alertas basada en registros a tu proyecto de Google Cloud mediante el Explorador de registros en Cloud Logging o mediante la API de Monitoring. Este contenido no se aplica a las políticas de alertas basadas en registros. Para obtener información sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.

Cómo administrar las políticas de alertas

Si deseas obtener información para ver una lista de las políticas de alertas basadas en métricas de tu proyecto y cómo modificarlas, consulta lo siguiente:

Para obtener información sobre cómo administrar las políticas de alertas basadas en registros, consulta Usa alertas basadas en registros.

Autorización necesaria para crear políticas de alertas

En esta sección, se describen las funciones o los permisos necesarios para crear una política de alertas. A fin de obtener información detallada sobre la administración de identidades y accesos (IAM) para Cloud Monitoring, consulta Control de acceso.

Cada función de IAM tiene un ID y un nombre. Los ID de las funciones tienen el formato roles/monitoring.editor y se pasan como argumentos a la herramienta de línea de comandos de gcloud cuando configuras el control de acceso. Para obtener más información, consulta Cómo otorgar, cambiar y revocar el acceso a los recursos. En Cloud Console, se muestran nombres de funciones, como el Editor de supervisión.

Funciones de Cloud Console requeridas

A fin de crear una política de alertas, el nombre de tu función de IAM para el proyecto de Google Cloud debe ser uno de los siguientes:

  • Editor de Monitoring
  • Administrador de Monitoring
  • Propietario del proyecto

Para ver una lista de las funciones y sus permisos asociados, consulta Funciones.

Permisos de API necesarios

Si deseas usar la API de Cloud Monitoring a fin de crear una política de alertas, tu ID de función de IAM para el proyecto de Google Cloud debe ser uno de los siguientes:

  • roles/monitoring.alertPolicyEditor: Este ID de función otorga los permisos mínimos que se necesitan para crear una política de alertas. Para obtener más detalles sobre esta función, consulta Funciones de alertas predefinidas.
  • roles/monitoring.editor
  • roles/monitoring.admin
  • roles/owner

A fin de identificar el permiso necesario para un método específico de la API de Cloud Monitoring, consulta Permisos de la API de Cloud Monitoring. Para ver una lista de las funciones y sus permisos asociados, consulta Funciones.

Determina tu función

Para determinar tu función en un proyecto con Cloud Console, haz lo siguiente:

  1. Abre Cloud Console y selecciona el proyecto de Google Cloud:

    Ir a Cloud Console

  2. Para ver tu función, haz clic en IAM y administrador. Tu función está en la misma línea que tu nombre de usuario.

Para determinar tus permisos a nivel de la organización, comunícate con el administrador de la organización.

Costos asociados con las políticas de alertas

No hay costos asociados con el uso de políticas de alertas o verificaciones de tiempo de actividad, pero se aplican los siguientes límites:

Categoría Valor Tipo de política1
Políticas de alertas (suma del registro y la métrica) por alcance de métricas 2 500 Métrica, registro
Condiciones por política de alertas 6 Métrica
Período máximo que
una condición de ausencia de métricas evalúa3
1 día Métrica
Período máximo que
una condición de umbral de métrica evalúa3
23 horas y 30 minutos Métrica
Canales de notificaciones por política de alertas 16 Métrica, registro
Frecuencia máxima de notificaciones 1 notificación cada 5 minutos por cada alerta basada en registros Registro
Cantidad máxima de notificaciones 20 notificaciones por día por cada alerta basada en registros Registro
Cantidad máxima de incidentes abiertos simultáneamente
por política de alertas
5000 Métrica
Período después del cual se cierra automáticamente
un incidente sin datos nuevos
7 días Métrica
Duración máxima de un incidente si no se cierra de forma manual 7 días Registro
Retención de incidentes cerrados 13 meses No aplicable
Retención de incidentes abiertos Indefinido No aplicable
Canales de notificaciones por alcance de métricas 4000 No aplicable
Verificaciones de tiempo de actividad por alcance de métricas 4 100 No aplicable
1Métrica: una política de alertas basada en datos de métricas; Registro: una política de alertas basada en mensajes de registro (alertas basadas en registros)
2Apigee y Apigee Hybrid están profundamente integrados en Cloud Monitoring. El límite de alertas para todos los niveles de suscripción de Apigee (Standard, Enterprise y Enterprise Plus) es el mismo que para Cloud Monitoring: 500 por alcance de métrica.
3El período máximo que una condición evalúa es la suma del período de alineación y los valores del período de duración. Por ejemplo, si el período de alineación se establece en 15 horas y el período de duración se establece en 15 horas, se requieren 30 horas de datos para evaluar la condición.
4Se aplica este límite a la cantidad de configuraciones de verificación de tiempo de actividad. Cada configuración incluye el intervalo de tiempo entre la prueba del estado del recurso especificado. Consulta Administra verificaciones de tiempo de actividad para obtener más información.

Para obtener información detallada sobre los precios, consulta Precios de Google Cloud's operations suite.

¿Qué sigue?