En esta página, se describe cómo crear una política de alertas en Cloud Monitoring para un objetivo de nivel de servicio (SLO) que creas en Anthos Service Mesh.
Para obtener una introducción a los SLO, consulta la Descripción general de los objetivos de nivel de servicio.
Cloud Monitoring puede activar una alerta cuando un servicio está por infringir un SLO. Puedes crear una política de alertas basada en la frecuencia de consumo de tu porcentaje de error aceptable. Todas las alertas sobre porcentaje de error aceptable tienen la misma condición básica: un porcentaje especificado del porcentaje de error aceptable para el período de cumplimiento se consume en un período de visualización, que es un período, como los 60 minutos anteriores. Cuando creas la política de alertas, Anthos Service Mesh establece de forma automática la mayoría de las condiciones para la alerta según la configuración del SLO. Debes especificar el período de visualización y el porcentaje de consumo.
Determinar los valores que debes establecer para el período de visualización y el porcentaje de consumo podría requerir prueba y error. Puedes usar el período de visualización predeterminado de 60 minutos como punto de partida. A fin de determinar el porcentaje de consumo, supervisa el comportamiento del servicio para ver qué porcentaje del porcentaje de error aceptable total (durante el período de cumplimiento) se consumió en los 60 minutos anteriores. Debes establecer un porcentaje de consumo a fin de que el porcentaje de error aceptable en el período de visualización no sea mayor al deseado, pero no querrás establecer una alerta innecesaria.
Por ejemplo, supongamos que creaste un SLO con el siguiente nombre: 95% < 300ms Latency in Calendar Week
.
Con este SLO, solo el 5% de la cantidad total de solicitudes en una semana puede tener una latencia superior a 300 ms. Alcanzar o superar el 5% consume el porcentaje de error aceptable. Si estableces el período de visualización en una hora, cada período de visualización es 1/168
de tu período de cumplimiento (hay 168 horas en una semana). Para calcular el porcentaje de consumo por hora que no supera el porcentaje de error aceptable total de la semana, se realiza este cálculo: 5%
÷ 168
≈ 0.3%
Debido a que la latencia de tu servicio puede variar según la carga o cualquier otra condición, configurar el porcentaje de consumo en 0.3% podría activar alertas innecesarias. Puedes comenzar con un valor que sea el doble, 0,6%, y luego supervisar tu servicio y ajustar el valor según sea necesario.
Antes de comenzar
Crea un SLO para uno de tus servicios.
Crea una política de alertas en un SLO
Ve a la pestaña Estado de un servicio:
En la consola de Google Cloud, ve a Anthos Service Mesh.
Selecciona el proyecto de Google Cloud de la lista desplegable de la barra de menú.
Haz clic en el servicio para el que quieres crear una política de alertas.
En la barra de navegación izquierda, haz clic en Estado.
Haz clic en el SLO para el que deseas crear una política de alertas.
En la sección Estado actual del SLO a la derecha, haz clic en el vínculo Crear política de alertas.
Aparecerá el cuadro de diálogo Agregar condición. Anthos Service Mesh propaga de forma automática la condición SLO Burn Rate según la configuración del SLO. Configura la condición SLO Burn Rate para recibir una alerta cuando el porcentaje de error aceptable del SLO disminuye demasiado rápido. Querrás recibir una alerta antes de que el SLO se quede sin porcentaje de error aceptable.
Para configurar la condición, sigue estos pasos:
- A fin de asignar un nombre a la condición, haz clic en el vínculo Suggested title a fin de usar el nombre según tu SLO o ingresa un nombre para la condición.
- En la sección Destino (Target), ingresa el período de visualización en el campo Lookback Duration o usa el valor predeterminado.
- En la sección Configuración (Configuration), ingresa el porcentaje de consumo en el campo Umbral (Threshold).
- Haz clic en Guardar. Aparecerá la ventana Create new alerting policy.
Para configurar la política de alertas, sigue estos pasos:
- Ingresa un nombre para la política.
- La condición se propaga de forma automática, pero tienes la opción de agregar otra condición.
- Si la política de alertas tiene una sola condición, deja el campo Policy triggers en el valor predeterminado Any condition is met.
- De manera opcional, configura las secciones Notificaciones y Documentación. Consulta Managing alerting policies para obtener más información.
- Haz clic en Guardar. Se muestra la página Detalles de la política.
- Para volver al panel de Anthos Service Mesh, haz clic en el menú de navegación dehaze y ve a Anthos > Servicios.
¿Qué sigue?
Obtén más información sobre las alertas de la ingeniería de confiabilidad de sitios de Google: