Indicadores de nivel de servicio transparente (SLI)

Supervise los servicios de Google Cloud y cómo afectan sus cargas de trabajo

stackdriver-sre-hero-banner

La TI moderna se basa en las estadísticas

Actualmente, contar con un enfoque integral impulsado por las métricas es un objetivo básico para la mayoría de los equipos de TI. Muchas empresas actuales evalúan la TI en función de la disponibilidad de los servicios y el rendimiento. Sin embargo, los equipos de TI que dependen de los servicios en la nube pueden tener dificultades para obtener datos sólidos sobre los servicios que brindan los proveedores externos. Si ocurren problemas, ¿cómo se detectan? ¿Con la pila o con el proveedor de servicios? Los SLI transparentes permiten supervisar los servicios de Google Cloud y su efecto en las cargas de trabajo para tener un panorama completo.

measure-all-the-things

Mida todos los datos

Para ayudar a los equipos de TI a comprender el rendimiento de todos los componentes de tus servicios, Google ofrece métricas detalladas a nivel de la API de más de 130 servicios de Google Cloud. En ellas, se muestra el conteo de errores y la latencia de las solicitudes de tus aplicaciones a cada servicio de Google. Esto te permite ver las correlaciones y los efectos secundarios entre tus aplicaciones y los servicios de los que dependen, lo que sirve para acelerar el análisis de las causas de origen y el tiempo de resolución.

real-transparency

Transparencia real

Los SLI trascienden las nociones tradicionales de “estado del servicio”. Puedes ver las interacciones específicas entre los servicios y correlacionarlas con los datos del entorno. Esto permite combinar métricas de servicio en función de varios atributos, como la ubicación del servicio, las credenciales de la aplicación que lo llama, su versión y el código de respuesta, a fin de ayudarte a explorar las relaciones y determinar las causas y los efectos.

Uso de los NST transparentes en la práctica

  • Si todas las llamadas a un servicio fallan solo para un usuario, es posible que el problema esté relacionado con la cuenta y, por lo tanto, pueda solucionarlo fácilmente por su cuenta.
  • Si estás solucionando un problema en tu app y detectas una correlación entre la disminución del rendimiento de tu aplicación y un aumento sostenido en la latencia de un servicio crítico de Google Cloud, debes comunicarte con nosotros para solicitar ayuda.
  • Si las latencias de un servicio de Google Cloud indican que no hay problemas ni cambios, pero las métricas internas de la app señalan que la latencia de las llamadas al servicio es inusualmente alta, quiere decir que tal vez haya problemas en la red. Comunícate con tu operador de red (Google, en algunos casos) para iniciar el proceso de depuración.

Nuestro compromiso con la transparencia

En Google Cloud, estamos comprometidos con compartir información detallada sobre el rendimiento de nuestros servicios. Esto es similar a los datos que los SRE de Google usan para mantener tales servicios en funcionamiento. Con esa información, puedes supervisar fácilmente nuestro desempeño a fin de que todos estemos al tanto de los problemas cuando trabajemos juntos en un ticket de servicio. Creemos que los SLI transparentes mejorarán tu experiencia con la asistencia tecnológica y tu confianza en la computación en la nube.

Google Cloud

Comience ahora

Para comenzar a recopilar y explorar las métricas transparentes del servicio, vaya al Explorador de métricas de Cloud Monitoring y seleccione "Consumed API" como el tipo de recurso. Verá una lista de las métricas sobre las que puede obtener información según los productos y servicios que usa en su aplicación. Luego, puede elegir las métricas que le interesen para su entorno. Si quiere limitar los datos que se muestran, indique el servicio, el método, la ubicación, la credencial o el código de error que quiere supervisar.

Cuando decida cuáles son las métricas más importantes para su aplicación, cree paneles personalizados que muestren sus indicadores clave junto con los nuestros a fin de tener toda la información en una sola pantalla para jerarquizar las causas generales de los problemas. Por último, cuando tengas un buen modelo de referencia a largo plazo del comportamiento de los servicios de Google en tu tráfico y sepas cuál es la tolerancia de tu aplicación, recomendamos que configures alertas para informarte sobre cambios en el comportamiento a largo plazo.

Comenzar