Indicadores de nivel de servicio transparentes (SLI) de Stackdriver

Supervisa los servicios de Google Cloud y cómo influyen en tus cargas de trabajo.

stackdriver-sre-hero-banner

La TI moderna se basa en las estadísticas

Actualmente, contar con un enfoque integral impulsado por las métricas es un objetivo mínimo para la mayoría de los equipos de TI. Muchas empresas actuales evalúan la TI en función de la disponibilidad de los servicios y el rendimiento. Sin embargo, los equipos de TI que dependen de los servicios en la nube pueden tener dificultades para obtener datos sólidos sobre los servicios que brindan los proveedores externos. Si ocurren problemas, ¿cómo se detectan? ¿Con la pila o con el proveedor de servicios? Los NST transparentes te permiten supervisar los servicios de Google Cloud y su efecto en tus cargas de trabajo a fin de analizar el panorama completo.

measure-all-the-things

Mide todos los datos

Para ayudar a los equipos de TI a comprender el rendimiento de todos los componentes de tus servicios, Google ofrece métricas detalladas a nivel de la API de más de 130 servicios de Google Cloud. En ellas, se muestra el conteo de errores y la latencia de las solicitudes de tus aplicaciones a cada servicio de Google. Esto te permite ver las correlaciones y los efectos secundarios entre tus aplicaciones y los servicios de los que dependen, lo que sirve para acelerar el análisis de las causas de origen y el tiempo de resolución.

real-transparency

Transparencia real

Los NST van mucho más allá de las nociones tradicionales del “estado de los servicios”. Con ellos, puedes ver las interacciones específicas entre los servicios y correlacionarlos con los datos del entorno. Esto te permite combinar métricas de servicio en función de varios atributos, como la ubicación del servicio, las credenciales de la app que lo llama, su versión y el código de respuesta, a fin de ayudarte a explorar las relaciones y determinar las causas y los efectos.

Uso de los NST transparentes en la práctica

  • Si todas las llamadas a un servicio fallan solo para un usuario, es posible que el problema esté relacionado con la cuenta y, por lo tanto, puedas solucionarlo fácilmente.
  • Si estás solucionando problemas en tu app y detectas una correlación entre la disminución del rendimiento y el aumento constante de la latencia de un servicio fundamental de GCP, debes comunicarte con nosotros para solicitar ayuda.
  • Si las latencias de un servicio de GCP indican que no hay problemas ni cambios, pero las métricas internas de la app señalan que la latencia de las llamadas al servicio es inusualmente alta, quiere decir que tal vez haya problemas en la red. Comunícate con tu operador de red (Google, en algunos casos) para iniciar el proceso de depuración.

Nuestro compromiso con la transparencia

En Google Cloud, estamos comprometidos con compartir información detallada sobre el rendimiento de nuestros servicios. Esto es similar a los datos que los SRE de Google usan para mantener tales servicios en funcionamiento. Con esa información, puedes supervisar fácilmente nuestro desempeño a fin de que todos estemos al tanto de los problemas cuando trabajemos juntos en un ticket de servicio. Creemos que los NST transparentes mejorarán tu experiencia con la asistencia tecnológica y tu confianza en la computación en la nube.

Google Cloud

Comienza ahora

Para comenzar a recopilar y explorar las métricas transparentes del servicio, ve al Explorador de métricas de Stackdriver y selecciona “Consumed API” como el tipo de recurso. Verás una lista de las métricas sobre las que puedes obtener información de acuerdo con los productos y servicios que usas en tus aplicaciones. Luego, puedes elegir las métricas que te interesen para tu entorno. Si quieres limitar los datos que se muestran, indica el servicio, el método, la ubicación, la credencial o el código de error que quieres supervisar.

Cuando decidas cuáles son las métricas más importantes para tu app, crea paneles personalizados que muestren tus indicadores clave junto con los nuestros a fin de tener toda la información en una sola pantalla para jerarquizar las causas generales de los problemas. Por último, cuando tengas un buen modelo de referencia a largo plazo del comportamiento de los servicios de Google en tu tráfico y sepas cuál es la tolerancia de tu app, recomendamos que configures alertas para informarte sobre cambios en el comportamiento a largo plazo.

Comenzar