Descripción general de las alertas

En este documento, se describe cómo puedes recibir una notificación cuando falla tu aplicación o cuando el rendimiento de una aplicación no cumple con los criterios definidos.

Cómo funcionan las alertas

El proceso de alertas de Cloud Monitoring contiene tres partes:

  • Una política de alertas, que describe las circunstancias en las que deseas recibir alertas y cómo deseas que se te notifique sobre un incidente. La política de alertas puede supervisar los datos de series temporales que almacena Cloud Monitoring o los registros que almacena Cloud Logging. Cuando esos datos cumplen con la condición de la política de alertas, Cloud Monitoring crea un incidente y envía las notificaciones.

  • Cada incidente es un registro del tipo de datos que se supervisaron y cuándo se cumplieron las condiciones. Esta información puede ayudarte a solucionar los problemas que causaron el incidente.

  • Un canal de notificaciones define cómo recibir las notificaciones cuando Cloud Monitoring crea un incidente. Por ejemplo, puedes configurar un canal de notificaciones para enviar un correo electrónico a my-support-team@example.com y publicar un mensaje de Slack en el canal #my-support-team. Una política de alertas puede contener uno o más canales de notificaciones.

Las políticas de alertas pueden evaluar dos tipos de datos:

  • Datos de series temporales, también llamados datos de métricas, que Monitoring almacena Estos tipos de políticas se denominan políticas de alertas basadas en métricas.

    Para aprender a configurar una política de alertas basada en métricas, prueba la Guía de inicio rápido para Compute Engine.

  • Datos de registro almacenados por Cloud Logging. Estos tipos de políticas se denominan políticas de alertas basadas en registros. Las políticas de alertas basadas en registros te notifican cuando aparece un mensaje en particular en tus registros.

    Este documento se centra en las políticas de alertas basadas en métricas, con información general sobre las políticas de alertas basadas en registros cuando sea relevante. Para obtener información detallada sobre las políticas de alertas basadas en registros, consulta Supervisa tus registros.

El proceso de alerta te ayuda a responder ante problemas cuando el rendimiento de una aplicación no cumple con los valores aceptables. Por ejemplo, implementa una aplicación web en una instancia de máquina virtual (VM) de Compute Engine. Si bien se espera que la latencia de la respuesta HTTP fluctúe, querrás que el equipo de asistencia al cliente responda cuando la aplicación tenga latencia alta durante un período significativo. Puedes crear una política de alertas basada en métricas que supervise la métrica de latencia de respuesta HTTP de la aplicación. Si la latencia de respuesta es superior a dos segundos durante al menos cinco minutos, Monitoring crea un incidente y envía notificaciones por correo electrónico a tu equipo de asistencia.

Cómo crear una política de alertas

Existen varias formas de crear una política de alertas. Por ejemplo, puedes usar políticas de alertas preconfiguradas si habilitas las alertas recomendadas de integraciones o ciertas páginas en la consola de Google Cloud. También puedes configurar una política de alertas nueva mediante la consola de Google Cloud, la API de Cloud Monitoring, Google Cloud CLI y Terraform.

Usa integraciones y alertas recomendadas

Cloud Monitoring proporciona paquetes compilados previamente que te permiten crear políticas de alertas para tus servicios de Google Cloud y las integraciones de terceros. Los paquetes incluyen políticas de alertas recomendadas, paneles de muestra y métricas clave para el servicio. Estos paquetes están disponibles para los servicios de Google Cloud, como Google Kubernetes Engine, Compute Engine y Cloud SQL, y para las integraciones comunes de terceros, como MongoDB, Kafka y Elasticsearch.

Cuando instalas un paquete, puedes habilitar sus alertas recomendadas. Cuando habilitas la alerta, proporcionas tus canales de notificación y usas la configuración predeterminada de las alertas o ajustas la configuración según sea necesario. La política de alertas comienza a supervisar su destino de inmediato, sin necesidad de ingresar entradas adicionales del usuario.

Las políticas de alertas recomendadas son útiles cuando implementaste un servicio nuevo y deseas generar alertas sobre métricas importantes. Por ejemplo, el paquete de integración de Cloud SQL incluye alertas recomendadas para instancias con errores y transacciones lentas:

Dos de las alertas recomendadas para el paquete de integración de Cloud SQL.

Para obtener más información sobre las integraciones de alertas, consulta Supervisa aplicaciones de terceros.

Use Cloud Monitoring

Si deseas crear una política de alertas y elegir su tipo de condición junto con otros componentes, como el tipo de métrica y las series temporales, usa Cloud Monitoring. En la siguiente tabla, se enumeran los diferentes tipos de condiciones que puedes usar cuando creas una política de alertas.

Tipo de condición Descripción Ejemplo
Condición de umbral de métrica

Las condiciones de umbral de métrica se activan cuando los valores de una métrica son superiores o inferiores a un umbral para un período de duración específico.

Para obtener más información, consulta Crea políticas de alertas para el umbral de métricas y Crea políticas de alertas mediante la API.

Quieres una política de alertas que envíe una alerta cuando la latencia de los recursos sea de 500 ms o más durante cinco verificaciones de tiempo de actividad consecutivas durante 10 minutos.
Condición de ausencia de métricas

Las condiciones de ausencia de métricas se activan cuando una serie temporal supervisada no tiene datos durante un período de duración específico. El período de duración es de hasta 24 horas si creas la condición en la consola de Google Cloud o de 24.5 horas en la API de Cloud Monitoring.

Para obtener más información, consulta Crea políticas de alertas de ausencia de métricas y Crea políticas de alertas mediante la API.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia cuando un recurso no responda a ninguna solicitud HTTP en el transcurso de cinco minutos.
Condición de valor de métrica prevista

Las condiciones de valor de métrica previsto se activan cuando la política de alertas predice que el umbral se incumplirá en el próximo período de previsión. La ventana de previsión puede variar de 1 a 7 días.

Para obtener más información, consulta Crea políticas de alertas sobre valores de métricas previstos y Crea políticas de alertas mediante la API.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia al cliente cuando es probable que un recurso alcance el 80% de uso del espacio en disco en las próximas 24 horas.
Condición basada en registros

Las condiciones de alerta basadas en registros se activan cuando la política de alertas detecta que una métrica basada en registros coincide con los criterios de la política de alertas. Las métricas basadas en registros derivan datos métricos del contenido de las entradas de registro. Por ejemplo, puedes usar una métrica basada en registros para contar la cantidad de entradas de registro que contienen un mensaje en particular o extraer información sobre la latencia registrada en entradas de registro.

Para obtener más información, consulta Configura alertas basadas en registros y Crea una alerta basada en registros con la API de Monitoring.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia cuando el proyecto tenga al menos 50 entradas de registro con un message que contenga product_ids=['tier_1_support', 'tier_2_support'].

Componentes de la política de alertas

Cada política de alertas tiene los siguientes componentes:

  • Una condición que describe cuándo un recurso, o un grupo de recursos, se encuentra en un estado que requiere que respondas. La condición incluye la fuente de datos, un umbral estático o dinámico y los métodos de agregación de datos, como ventanas de visualización, filtros y Groupby. Tus condiciones pueden supervisar una sola métrica, varias métricas o una proporción de métricas. También puedes usar lenguajes de consulta como PromQL y el lenguaje de consulta de Monitoring (MQL) para incluir expresiones complejas, como umbrales dinámicos y lógica condicional.

    Si usas una integración para habilitar una política de alertas recomendada, la condición de la política de alertas se prepropaga.

  • Una lista de canales de notificaciones que describe a quién notificar cuando se requiere una acción. Para obtener más información, consulta Cómo crear y administrar canales de notificaciones.

  • Documentación que aparece en las notificaciones y las páginas de incidentes. Puedes configurar el asunto de una notificación y puedes agregar información útil al cuerpo de la notificación. Por ejemplo, puedes configurar la notificación para que muestre vínculos a guías internas o a páginas de Google Cloud, como paneles personalizados. Para obtener más información sobre la documentación, incluidos los ejemplos, consulta Anota alertas con la documentación definida por el usuario.

Lenguajes de consulta

Usa los lenguajes de consulta y los filtros en las políticas de alertas para tener un mayor control sobre la evaluación de las métricas. Cloud Monitoring admite los siguientes tipos de consultas:

  • Las alertas de PromQL te permiten configurar políticas de alertas para usar Prometheus Query Language. Tus consultas de PromQL pueden usar cualquier tipo de expresión válida de lenguaje de consulta de Prometheus, como combinaciones de métricas, relaciones y umbrales de escalamiento. Las alertas de PromQL también permiten ejecutar alertas por completo basadas en Google Cloud CLI, que quita las dependencias de la infraestructura de alertas externa. Para obtener más información, consulta PromQL en Cloud Monitoring y Políticas de alertas con PromQL.

  • El lenguaje de consulta de Monitoring (MQL) es una interfaz expresiva basada en texto que te permite recuperar, filtrar y manipular datos de series temporales. Puedes crear políticas de alertas con condiciones que incluyan una operación de alerta del lenguaje de consulta Para obtener más información, consulta la descripción general del lenguaje de consulta de Monitoring y Políticas de alertas con MQL.

  • Los filtros de supervisión te permiten configurar políticas de alertas para usar proporciones de métricas basadas en filtros. Las políticas de alertas basadas en filtros no se pueden ver ni modificar en la consola de Google Cloud. Para ver un ejemplo de una política que usa filtros de Monitoring, consulta Proporción de métrica.

Administra incidentes y políticas de alertas

Después de habilitar una política de alertas, Cloud Monitoring supervisa de forma continua las condiciones de esa política. No puedes configurar la política de alertas para supervisar las condiciones solo durante ciertos períodos. Si deseas inhabilitar la política de alertas durante un período determinado, crea una función Posponer.

Si un incidente está abierto y Monitoring determina que ya no se cumplen las condiciones de la política basada en métricas, Monitoring cierra automáticamente el incidente y envía una notificación sobre el cierre.

Precios

En general, las métricas del sistema de Cloud Monitoring son gratuitas y las métricas de sistemas, agentes o aplicaciones externos no lo son. Las métricas facturables se facturan según la cantidad de bytes o de muestras transferidas.

Para obtener más información sobre los precios de Cloud Monitoring, consulta los siguientes documentos:

Para obtener información sobre cómo supervisar la cantidad de intervalos o registros de seguimiento que se transfieren, o cómo recibir notificaciones cuando se incluye contenido específico en una entrada de registro, consulta los siguientes vínculos:

¿Qué sigue?