Se usó la API de Cloud Translation para traducir esta página.

Descripción general de las alertas

En este documento, se describe cómo recibir notificaciones cuando tu aplicación falla o cuando su rendimiento no cumple con los criterios definidos.

Cómo funcionan las alertas

El proceso de alertas de Cloud Monitoring contiene tres partes:

Una política de alertas, que describe las circunstancias en las que quieres recibir alertas y cómo quieres que se te notifique sobre un incidente. La política de alertas puede supervisar datos de series temporales almacenados por Monitoring o registros almacenados por Cloud Logging. Cuando esos datos cumplen con la condición de la política de alertas, Monitoring crea un incidente y envía las notificaciones.
Cada incidente es un registro del tipo de datos que se supervisaron y de cuándo se cumplieron las condiciones. Esta información puede ayudarte a solucionar los problemas que causaron el incidente.
Un canal de notificaciones define cómo recibes notificaciones cuando Monitoring crea un incidente. Por ejemplo, puedes configurar una política de alertas para enviar un correo electrónico a my-support-team@example.com y publicar un mensaje de Slack en el canal #my-support-team. Una política de alertas puede contener uno o más canales de notificación.

Las políticas de alertas pueden evaluar tres tipos de datos:

Datos de series temporales, también llamados datos de métricas, que almacena Monitoring. Estos tipos de políticas se denominan políticas de alertas basadas en métricas.

Si deseas obtener información para configurar una política de alertas basada en métricas, prueba la Guía de inicio rápido para Compute Engine.
Son los datos de entrada de registro que almacena Cloud Logging. Las políticas de alertas que evalúan entradas de registro individuales se denominan políticas de alertas basadas en registros. Las políticas de alertas basadas en registros te notifican cuando aparece un mensaje en particular en tus registros. Para obtener más información, consulta Supervisa tus registros.
Son los resultados de una consulta en SQL que se ejecuta en Análisis de registros en relación con los datos de entrada de registro almacenados en Logging. Las políticas de alertas que supervisan los resultados de una consulta en SQL se denominan políticas de alertas basadas en SQL. Para obtener más información, consulta Supervisa los resultados de tus consulta en SQL con una política de alertas.

Las políticas de alertas basadas en SQL están en versión preliminar pública.

El proceso de alertas te ayuda a responder a los problemas cuando el rendimiento de una aplicación no alcanza los valores aceptables. Por ejemplo, implementas una aplicación web en una instancia de máquina virtual (VM) de Compute Engine. Aunque esperas que la latencia de respuesta de HTTP fluctúe, quieres que tu equipo de asistencia responda cuando la aplicación tenga una latencia alta durante un período significativo. Podrías crear una política de alertas basada en métricas que supervise la métrica de latencia de respuesta HTTP de la aplicación. Si la latencia de respuesta es superior a dos segundos durante al menos cinco minutos, Monitoring crea un incidente y envía notificaciones por correo electrónico a tu equipo de asistencia.

Cómo crear una política de alertas

Existen varias formas de crear una política de alertas. Por ejemplo, puedes usar políticas de alertas preconfiguradas habilitando las alertas recomendadas desde las integraciones o ciertas páginas de la consola de Google Cloud . También puedes configurar una política de alertas nueva con laGoogle Cloud consola, la API de Cloud Monitoring, la CLI de Google Cloud y Terraform.

Usa integraciones y políticas de alertas recomendadas

Monitoring proporciona paquetes prediseñados para que puedas crear políticas de alertas para tusGoogle Cloud servicios y las integraciones de terceros. Los paquetes incluyen políticas de alertas recomendadas, paneles de muestra y métricas clave para el servicio. Estos paquetes están disponibles paraGoogle Cloud servicios como Google Kubernetes Engine, Compute Engine y Cloud SQL, y para integraciones comunes de terceros, como MongoDB, Kafka y Elasticsearch.

Cuando instalas un paquete, puedes habilitar las políticas de alertas recomendadas del paquete. Cuando habilitas una política de alertas recomendada, configuras su canal de notificación y, de manera opcional, modificas otros valores. Después de la configuración, la política de alertas comienza a supervisar su destino de inmediato, sin necesidad de que el usuario realice ninguna otra acción.

Las políticas de alertas recomendadas son útiles cuando implementaste un servicio nuevo y deseas recibir alertas sobre métricas importantes. Por ejemplo, el paquete de integración de Cloud SQL incluye políticas de alertas recomendadas para instancias con errores y transacciones lentas:

Dos de las políticas de alertas recomendadas para el paquete de integración de Cloud SQL.

Para obtener más información sobre las integraciones de alertas, consulta Supervisa aplicaciones de terceros.

Crea políticas de alertas nuevas

Puedes crear políticas de alertas para supervisar diferentes tipos de datos según tus necesidades de alertas. En las siguientes secciones, se enumeran los diferentes tipos de datos que puedes supervisar con las políticas de alertas.

Supervisa datos de series temporales

Tipo de condición	Descripción	Ejemplo
Condición de umbral de métrica	Las condiciones de umbral de métrica se cumplen cuando los valores de una métrica son superiores o inferiores a un umbral para un período de nueva prueba específico. Para obtener más información, consulta Crea políticas de alertas de límite de métrica y Crea políticas de alertas con la API.	Quieres una política de alertas que envíe una notificación cuando la latencia de respuesta sea de 500 ms o más durante cinco verificaciones de tiempo de actividad consecutivas en un período de 10 minutos.
Condición de ausencia de métricas	Las condiciones de ausencia de métricas se cumplen cuando una serie temporal supervisada no tiene datos para un período de nueva prueba específico. El período máximo para volver a realizar la prueba es de 23.5 horas. Para obtener más información, consulta Crea políticas de alertas de falta de métricas y Crea políticas de alertas con la API.	Quieres una política de alertas que abra un incidente con tu equipo de asistencia al cliente cuando un recurso no responda a ninguna solicitud HTTP en el transcurso de cinco minutos.
Condición de valor de métrica previsto	Las condiciones de valor de métrica previsto se cumplen cuando la política de alertas predice que se incumplirá el umbral dentro del próximo período de previsión. El período de previsión puede variar de 1 hora a 7 días. Para obtener más información, consulta Crea políticas de alertas de valores de métricas previstas y Crea políticas de alertas con la API.	Deseas una política de alertas que abra un incidente con tu equipo de asistencia cuando es probable que un recurso alcance el 80% de uso del espacio en disco en las próximas 24 horas.

Tipo de condición

Descripción

Ejemplo

Condición de umbral de métrica

Las condiciones de umbral de métrica se cumplen cuando los valores de una métrica son superiores o inferiores a un umbral para un período de nueva prueba específico.

Para obtener más información, consulta Crea políticas de alertas de límite de métrica y Crea políticas de alertas con la API.

Quieres una política de alertas que envíe una notificación cuando la latencia de respuesta sea de 500 ms o más durante cinco verificaciones de tiempo de actividad consecutivas en un período de 10 minutos.

Condición de ausencia de métricas

Las condiciones de ausencia de métricas se cumplen cuando una serie temporal supervisada no tiene datos para un período de nueva prueba específico. El período máximo para volver a realizar la prueba es de 23.5 horas.

Para obtener más información, consulta Crea políticas de alertas de falta de métricas y Crea políticas de alertas con la API.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia al cliente cuando un recurso no responda a ninguna solicitud HTTP en el transcurso de cinco minutos.

Condición de valor de métrica previsto

Las condiciones de valor de métrica previsto se cumplen cuando la política de alertas predice que se incumplirá el umbral dentro del próximo período de previsión. El período de previsión puede variar de 1 hora a 7 días.

Para obtener más información, consulta Crea políticas de alertas de valores de métricas previstas y Crea políticas de alertas con la API.

Deseas una política de alertas que abra un incidente con tu equipo de asistencia cuando es probable que un recurso alcance el 80% de uso del espacio en disco en las próximas 24 horas.

Supervisa los datos de entrada de registro

Para supervisar entradas de registro individuales, usa una política de alertas basada en registros. Se cumple una condición en una política de alertas basada en registros cuando la política de alertas detecta que una frase de una entrada de registro coincide con los criterios de la política de alertas. Por ejemplo, deseas una política de alertas que abra un incidente con tu equipo de asistencia cuando el campo message de una entrada de registro contenga product_ids=['tier_1_support', 'tier_2_support'].

Para obtener más información, consulta Configura políticas de alertas basadas en registros en la documentación de Logging.

Supervisa los resultados de consulta en SQL

Para supervisar los resultados de consulta en SQL, usa una política de alertas basada en SQL. La condición de una política de alertas basada en SQL analiza periódicamente los datos de entrada de registro y, luego, crea incidentes cuando la tabla de resultados de la consulta cumple con ciertos criterios. Este tipo de política de alertas es útil cuando necesitas una política de alertas que supervise agregaciones de datos o patrones complejos en varias entradas de registro. Por ejemplo, deseas recibir una notificación cuando más de 50 entradas de registro en los últimos 60 minutos tengan una gravedad de WARNING.

Para obtener más información, consulta Supervisa los resultados de tus consulta en SQL con una política de alertas en la documentación de Logging.

Componentes de la política de alertas

Cada política de alertas tiene los siguientes componentes:

Es una condición que describe cuándo un recurso, o un grupo de recursos, se encuentra en un estado que requiere que respondas. La condición incluye la fuente de datos, un umbral estático o dinámico, y métodos de agregación de datos, como filtros y groupby. Tus condiciones pueden supervisar una sola métrica, varias métricas o una proporción de métricas. También puedes usar el lenguaje de consulta de Prometheus (PromQL) para incluir expresiones complejas, como umbrales dinámicos y lógica condicional.

Si usas una integración para habilitar una política de alertas recomendada, la condición de la política de alertas se completará previamente.
Es una lista de canales de notificaciones que describen a quién se debe notificar cuando se requiere una acción. Para obtener más información, consulta Cómo crear y administrar canales de notificaciones.
Documentación que aparece en las notificaciones y las páginas de incidentes. Puedes configurar el asunto de una notificación y agregar información útil al cuerpo de la notificación. Por ejemplo, puedes configurar la notificación para que muestre vínculos a guías internas o a páginas de Google Cloud , como los paneles personalizados. Para obtener más información sobre la documentación, incluidos ejemplos, consulta Cómo anotar incidentes con documentación definida por el usuario.

Lenguajes de consulta

Usa lenguajes de consulta y filtros en tus políticas de alertas para tener un mayor control sobre la evaluación de tus métricas. Monitoring admite los siguientes tipos de consultas:

El lenguaje de consulta de Prometheus (PromQL) es un lenguaje de consulta funcional que se usa para evaluar los datos de series temporales en tiempo real. Puedes configurar políticas de alertas para incluir una consulta de PromQL en su condición. Tus consultas de PromQL pueden usar cualquier expresión válida, como combinaciones de métricas, proporciones y umbrales de ajuste. Si configuras políticas de alertas basadas en PromQL en Google Cloud, puedes reducir las dependencias de la infraestructura de alertas externa. Para obtener más información, consulta PromQL en Cloud Monitoring y Descripción general de las alertas de PromQL.
Los filtros de Monitoring te permiten configurar políticas de alertas para usar proporciones de métricas basadas en filtros. Las políticas de alertas basadas en filtros no se pueden ver ni modificar en la consola de Google Cloud . Para ver un ejemplo de una política que usa filtros de Monitoring, consulta Proporción de métrica.
El lenguaje de consulta de Monitoring (MQL) es una interfaz expresiva basada en texto que te permite recuperar, filtrar y manipular datos de series temporales. Puedes crear políticas de alertas con condiciones que incluyan una operación de alerta del lenguaje de consultas de Monitoring. Para obtener más información, consulta la Descripción general del lenguaje de consultas de Monitoring y las Políticas de alertas con MQL.

Anuncio: A partir del 22 de octubre de 2024, Monitoring Query Language (MQL) dejará de ser un lenguaje de consulta recomendado para Cloud Monitoring. Se inhabilitarán algunas funciones de usabilidad, pero podrás ejecutar consultas en MQL en el Explorador de métricas, y los paneles y las políticas de alertas que usen MQL seguirán funcionando. Para obtener más información, consulta el aviso de baja de MQL.

Administra las políticas de alertas y los incidentes

Después de habilitar una política de alertas, Monitoring supervisa continuamente las condiciones de esa política. No puedes configurar la política de alertas para supervisar las condiciones solo durante ciertos períodos. Si deseas inhabilitar la política de alertas durante un período determinado, crea una posposición.

Si un incidente está abierto y Monitoring determina que las condiciones de la política basada en métricas ya no se cumplen, Monitoring cierra automáticamente el incidente y envía una notificación sobre el cierre.

Precios

En general, las métricas del sistema de Cloud Monitoring son gratuitas, y las métricas de sistemas, agentes o aplicaciones externos no lo son. Las métricas facturables se cobran según la cantidad de bytes o la cantidad de muestras transferidas.

Para obtener más información, consulta las secciones de Cloud Monitoring en la página de precios de Google Cloud Observability.

Para obtener información sobre cómo supervisar la cantidad de intervalos de seguimiento o registros que se transfieren, o cómo recibir notificaciones cuando se incluye contenido específico en una entrada de registro, consulta los siguientes documentos:

¿Qué sigue?

Para obtener más información sobre la latencia de notificaciones y cómo las opciones de los parámetros de una política de alertas afectan cuándo se envían, consulta Comportamiento de las políticas de alertas basadas en métricas.
Para ver una lista de ejemplos de políticas basadas en métricas, consulta Resumen de ejemplos de políticas de alertas.