Para supervisar un servicio, necesitas al menos un objetivo de nivel de servicio (SLO). Los SLO encapsulan los objetivos de rendimiento del servicio. Cada SLO se basa en una métrica de rendimiento denominada indicador de nivel de servicio (SLI). Para obtener información general sobre los SLI y SLO, consulta Conceptos de la supervisión del servicio.
Puedes crear hasta 500 SLO para un servicio.
Antes de comenzar
Para obtener los permisos que necesitas para ver y crear SLOs, pídele a tu administrador que te otorgue el rol de IAM de editor de Monitoring (roles/monitoring.editor
).
Para obtener más información sobre cómo otorgar roles, consulta Cómo administrar el acceso.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Cómo comenzar
Para definir un SLO, navega al panel Crea un objetivo de nivel de servicio (SLO).
-
En la consola de Google Cloud, ve a la página SLO:
Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.
Abre el panel Crea un objetivo de nivel de servicio (SLO):
Para un servicio nuevo, sigue estos pasos:
- Haz clic en Definir servicio y, luego, Define tu servicio.
- Después de hacer clic en Enviar en el panel Definir servicio, haz clic en Crear SLO.
Para un servicio existente, sigue estos pasos:
- En la lista Servicios, haz clic en el nombre del servicio en la lista Servicios.
- En la página Detalles del servicio, haz clic en Crear SLO.
El panel de creación de SLO te guiará a través de los pasos para crear uno. En el resto de esta sección, se describe cada uno de los siguientes pasos en el proceso de creación de SLO:
- Establecer el SLI
- Definir los detalles del SLI
- Establecer el SLO
- Revisar y guardar el SLO
Para ir al paso siguiente, haz clic en Continuar. Puedes hacer clic en un paso anterior para realizar cambios antes de guardar el SLO. Para salir del proceso de creación de SLO, haz clic en Cancelar.
Establece el SLI
El panel Establece tu SLI (Set your SLI) tiene los siguientes paneles secundarios:
Detalles del servicio (Service details), en el que se muestra información que identifica al servicio. Esto es lo mismo que el panel Detalles del servicio en el panel del servicio.
Elegir una métrica (Choose a metric), en el que eliges una métrica para el rendimiento que deseas supervisar.
¿Basado en las solicitudes o en Windows? (Request-based or windows-based?), en el que eliges cómo se evalúa la métrica.
La siguiente captura de pantalla muestra el panel de SLI:
Para obtener más información sobre las métricas usadas en los SLI y los métodos de evaluación, consulta el tema conceptual Indicadores de nivel de servicio.
Elige una métrica
La métrica de SLI especifica el tipo de rendimiento que deseas medir. En el SLI, se construye una proporción a partir de la métrica para medir un buen rendimiento a lo largo del tiempo. Tienes las siguientes opciones para los SLI:
- Disponibilidad (Availability), que mide qué tan disponible se encuentra el servicio para los usuarios.
- Latencia (Latency), que mide la capacidad de respuesta del servicio para los usuarios.
- Otro (Other), que te permite indicar que deseas usar una métrica específica. Debes especificar la métrica y describir cómo compilar el SLI en el panel Set SLI details.
Las opciones válidas dependen del tipo de servicio que configures.
Para los servicios en Cloud Service Mesh, Istio en Google Kubernetes Engine y App Engine, puedes elegir cualquiera de las opciones. Las métricas de disponibilidad y latencia ya son conocidas para estos servicios, pero puedes elegir Otro si deseas usar un SLI personalizado.
En el caso de los servicios basados en GKE y para los servicios personalizados, la única opción es Otro. Las métricas de Prometheus no se incluyen en los SLO de latencia y disponibilidad predeterminados, y otras métricas significativas de disponibilidad o latencia no se conocen de antemano para estos servicios.
Si configuraste la recopilación de métricas de Prometheus mediante Google Cloud Managed Service para Prometheus, puedes establecer una métrica de Prometheus recopilada como un SLI personalizado.
Elige el método de evaluación
Después de seleccionar la métrica para tu SLI, debes especificar cómo se la debería evaluar.
La evaluación basada en solicitudes mide la cantidad de solicitudes que cumplen con el criterio de evaluación en comparación con la cantidad total de solicitudes en un período determinado.
La evaluación basada en ventanas mide la cantidad de períodos de evaluación que cumplen con un criterio de calidad en comparación con la cantidad total de períodos de evaluación.
Para ambos métodos de evaluación, debes especificar los criterios de evaluación en la página Set SLI details.
Para obtener más información sobre estos tipos de evaluación, consulta Cumplimiento de los SLO basados en solicitudes y en ventanas.
Establece los detalles del SLI
El contenido del panel Define los detalles del SLI depende de la métrica y el método de evaluación que elegiste en el paso anterior.
Si eliges la métrica de disponibilidad y la evaluación basada en solicitudes, no se necesitan más detalles.
Evaluación basada en ventanas
Si seleccionaste la evaluación basada en ventanas, debes establecer los criterios adicionales para la ventana en este panel: un criterio de calidad y una duración.
El criterio de calidad indica el porcentaje de ventanas que deben evaluarse como “correctas” durante el período de cumplimiento. La duración especifica la longitud de la ventana.
Métrica de latencia
Si elegiste la métrica de latencia, debes especificar el valor del umbral que determina el rendimiento aceptable en este panel:
Cualquier elemento que supere el umbral de latencia se considera un rendimiento “incorrecto” en la evaluación del SLI.
SLI personalizado
Si seleccionaste Otro como la métrica del SLI, debes especificar la métrica que deseas usar en este panel. Para seleccionar una métrica, escribe en el campo Métrica de rendimiento (Performance Metric) o selecciona una de la lista.
Las métricas de la lista se dividen en dos tipos:
- Indicadores de corte de distribución
- Indicadores de proporción de serie temporal
Si recopilas métricas de Prometheus con Google Cloud Managed Service para Prometheus, el nombre de la métrica comienza con prometheus.googleapis.com/
.
En la siguiente captura de pantalla, se muestra una lista parcial:
Si seleccionas un indicador de corte de distribución, proporciona un rango (superior, inferior o entre) para configurar el SLI y un filtro a fin de especificar el recurso supervisado y las etiquetas que desees incluir. El panel de configuración se ve de la siguiente manera:
Si seleccionas un indicador de proporción de serie temporal, debes configurar la proporción mediante la compilación de filtros de numerador y denominador para clasificar los datos de métricas, por lo general, si seleccionas los valores de las etiquetas en el tipo de recurso o métrica. El panel de configuración se ve de la siguiente manera:
Si deseas obtener más información sobre estos tipos de SLI, consulta las páginas de referencia de la API de Monitoring para DistributionCut
y TimeSeriesRatio
.
Métricas del plano de control de GKE
Las métricas del plano de control de GKE son indicadores útiles del estado del sistema que puedes usar para los SLI personalizados. Debes habilitar la recopilación de estas métricas para poder usarlas. Google Cloud Managed Service para Prometheus recopila estas métricas.
- Usa [métricas del servidor de la API][gke-api-metrics] para realizar un seguimiento de la carga del servidor de la API, la fracción de solicitudes del servidor de la API que muestran errores y la latencia de respuesta de las solicitudes que recibe el servidor de la API.
- Usa las métricas del programador a fin de ayudarte a responder de forma proactiva a los problemas de programación cuando no hay suficientes recursos para los Pods pendientes.
Si deseas obtener más información sobre las métricas del plano de control y usarlas para supervisar el estado del sistema, consulta Usa métricas del plano de control.
Vista previa del gráfico
Después de configurar el SLI, en el panel Define los detalles del SLI, se incluye la vista previa de un gráfico en el que se muestra cómo el SLI mide el rendimiento histórico de este servicio. Por ejemplo:
Si acabas de crear o de implementar un servicio, es posible que aún no haya datos. Si bien puedes crear el SLI, no obtendrás la perspectiva histórica.
Establece tu SLO
El panel Establece tu SLO (Set your SLO) cuenta con las siguientes regiones:
Período de cumplimiento (Compliance period), en el que estableces el período en el que deseas evaluar el SLI.
Objetivo de rendimiento (Performance goal), en el que se especifica el umbral de rendimiento durante el período de cumplimiento.
Vista previa (Preview), que muestra un gráfico con el umbral de objetivos de rendimiento y un grafo con los resultados de la evaluación del SLI durante el período de cumplimiento.
Período de cumplimiento
Existen dos tipos de períodos de cumplimiento que puedes seleccionar en el menú:
- Período de calendario
- Ventana móvil
Un período de calendario mide el cumplimiento durante un período fijo, la duración del período. Cuando el período finaliza, el porcentaje de error aceptable se restablece y comienza un nuevo período de cumplimiento.
Las ventanas móviles son períodos variables. También tiene una duración, pero el cumplimiento se calcula en los últimos n días. Cuando comienza un día nuevo, el cumplimiento y el porcentaje de error aceptable se vuelven a calcular en los n días anteriores.
Para obtener más información sobre los períodos de calendario y de ventana móvil, consulta Períodos de cumplimiento.
Vista previa del gráfico
Después de configurar el SLO, en el panel Establece tu SLO (Set your SLO), se incluye la vista previa de un gráfico en el que se muestra cómo el SLO mide el rendimiento histórico de este servicio. Por ejemplo:
Si acabas de crear o de implementar un servicio, es posible que aún no haya datos. Si bien puedes crear el SLO, no obtendrás la perspectiva histórica.
Guarda tu SLO
El panel Revisar y guardar (Review and save) tiene un solo campo, un nombre visible para el SLO. El campo tiene un valor predeterminado basado en las selecciones que realizaste cuando definiste el SLO, pero puedes cambiarlo para que el nombre visible sea más descriptivo.
En el panel, también se proporciona una vista previa de tu SLO en formato JSON. En el bloque JSON, se resume el SLO, que se puede copiar para usarlo con el método serviceLevelObjectives.create
.
Si cambias alguno de los valores del SLO, la vista previa de JSON se actualiza automáticamente.
En la siguiente captura de pantalla, se muestra el campo con un nombre predeterminado:
Cuando estés satisfecho con el nombre visible, haz clic en Crear SLO.
¿Qué sigue?
Después de crear un SLO, puedes hacer lo siguiente:
Supervisar el rendimiento del servicio en relación con el SLO mediante la creación de una política de alertas. Para obtener más información, consulta Alertas sobre tu ritmo de consumo y Crea una política de alertas.
Visualiza el estado de todos los SLO de un conjunto de servicios mediante la creación de un panel personalizado en Cloud Monitoring que muestre gráficos de SLO. Para obtener más información, consulta Crea un panel personalizado y Muestra SLO en un panel.