Indicadores de nivel de servicio transparente de Stackdriver

Supervisa los servicios de Google Cloud y cómo afectan a las cargas de trabajo.

stackdriver-sre-hero-banner

Las infraestructuras de TI modernas se basan en cifras

En la actualidad, uno de los objetivos básicos de la mayoría de los equipos de operaciones de TI es emplear un enfoque exhaustivo y basado en métricas. Muchas empresas calculan el rendimiento de su infraestructura de TI en función de la disponibilidad y del rendimiento del servicio. Sin embargo, para aquellos equipos de TI que dependen de servicios en la nube, puede ser complicado obtener datos fiables de servicios proporcionados por proveedores de la nube externos. En caso de que haya un problema, ¿de dónde viene? ¿De la pila o del proveedor de servicios? Los indicadores de nivel de servicio (SLI) transparentes te permiten supervisar los servicios de Google Cloud y cómo afectan a las cargas de trabajo. Así, obtendrás una perspectiva completa.

measure-all-the-things

Medición de todos los parámetros

Para ayudar al equipo de TI a conocer el rendimiento de todos los componentes de tus servicios, Google ofrece métricas detalladas a nivel de API en más de 130 servicios de Google Cloud. Estas métricas muestran el número de errores y la latencia de tus solicitudes de aplicaciones en cada servicio de Google. De esta manera, puedes observar las correlaciones y los efectos colaterales que existan entre tus aplicaciones y los servicios de los que dependen, lo que te ayuda a analizar las causas de los problemas y a resolverlos más rápidamente.

real-transparency

Transparencia real

La información que ofrecen los SLI va más allá del concepto tradicional de "estado del servicio". Te permite observar las interacciones entre servicios y correlacionarlas con los datos del entorno. Así, podrás realizar análisis cruzados de las métricas de los servicios según distintos atributos, como la ubicación del servicio, las credenciales de la aplicación que llama al servicio, la versión y el código de respuesta. Todo ello te permitirá establecer correspondencias y determinar causas y efectos.

Uso de SLI transparentes en la práctica

  • Si un usuario observa que todas las llamadas a un servicio fallan y ningún otro usuario tiene el mismo problema, seguramente haya algún error con esa cuenta concreta y puedas solucionarlo tú mismo fácilmente.
  • Si estás solucionando un problema de una aplicación y observas que existe una relación entre el mal funcionamiento de esta y un aumento continuado de la latencia en un servicio crítico de GCP, deberás llamarnos para que podamos ayudarte.
  • Si la latencia de un servicio de GCP es óptima y no ha sufrido cambios pero las métricas de la aplicación indican que la latencia en las llamadas al servicio es inusualmente alta, significa que podría haber algún problema en la red. Ponte en contacto con tu proveedor de red (en determinados casos será Google) para que inicie el proceso de depuración.

Nuestro compromiso con la transparencia

En Google Cloud, nos comprometemos a facilitar información detallada sobre el rendimiento de nuestros servicios. Los datos son similares a los que utilizan los SRE de Google para mantener nuestros servicios en marcha. Dichos datos te permiten observar fácilmente lo que hacemos. Así, cuando acudas a nosotros para resolver cualquier incidencia, todo el mundo estará informado. Estamos convencidos de que los SLI transparentes mejorarán tu experiencia de asistencia técnica y aumentarán tu confianza en el cloud computing.

Google Cloud

Primeros pasos

Para empezar a recopilar y examinar métricas de servicio transparentes, accede al explorador de métricas de Stackdriver y selecciona "API Consumed" como el tipo de recurso. Verás una lista de métricas que podrás supervisar en función de los productos y servicios que estés utilizando en la aplicación. Luego, puedes seleccionar las que resulten más adecuadas para tu entorno. Indica qué servicio, método, ubicación, credencial o código de error quieres supervisar para restringir los datos que se muestran.

Cuando hayas decidido qué métricas te interesan más para tu aplicación, te recomendamos que crees paneles personalizados en los que se representen tus indicadores clave y los nuestros, de manera que obtengas una vista única que te permita identificar la causa general del problema. Por último, una vez que dispongas de una buena referencia a largo plazo de cómo se comportan los servicios de Google según tu tráfico y de cuál es la tolerancia de tu aplicación, podrás decidir si quieres configurar alertas que te avisen en caso de anomalía en el comportamiento a largo plazo.

Empezar