La SRE es una función de trabajo, una mentalidad y un conjunto de prácticas de ingeniería para ejecutar sistemas de producción confiables. Google Cloud te ayuda a implementar los principios de la SRE a través de herramientas, servicios profesionales y otros recursos.
Beneficios
Aprovecha los beneficios de la velocidad
Automatiza de extremo a extremo, desde la escritura de código hasta la ejecución de servicios en producción. Alinea el desarrollo y las operaciones en torno a los objetivos compartidos para ir más rápido. Conéctate con tus herramientas preferidas, incluida la administración de incidentes, a medida que minimizas el trabajo repetitivo.
Mejora la confiabilidad con principios de SRE comprobados
Aprovecha los principios de la SRE que se desarrollaron en Google y que demostraron funcionar a gran escala. Implementa fácilmente las prácticas recomendadas de SRE con la observabilidad de Google Cloud para acelerar la resolución de problemas y mejorar la confiabilidad.
Estamos disponibles para ayudarte en las etapas de tu recorrido hacia la SRE
Impulsa una entrega de software más alta, sin importar el tamaño de la empresa, la industria o si usas VMs, Kubernetes o sin servidores. Elige entre ofertas pagadas y herramientas pagadas para poner en marcha tu recorrido de SRE.
Características clave
Supervisa el estado de los servicios y trabaja con los desarrolladores para aumentar la velocidad de los cambios mediante la asistencia integrada de la supervisión de servicios. Selecciona métricas para SLI, configura SLO y haz un seguimiento de los porcentajes de error aceptables a fin de mitigar el riesgo para tu servicio. Usa herramientas potentes de paneles de control para agregar métricas y registros, incluidas señales de oro para reducir MTTR y responder preguntas sobre el estado del servicio con rapidez.
Usa nuestras integraciones integradas con las herramientas que te gustan para solucionar problemas con rapidez. Implementa lanzamientos progresivos y revierte los cambios de forma segura. Las integraciones ya compiladas con Cloud Build están disponibles para permitirte compilar, probar y, también, implementar artefactos en Google Kubernetes Engine, App Engine, Cloud Functions, Firebase y Cloud Run como parte de tu IC/CD.
Obtén una vista unificada de registros, eventos, métricas y SLO. Obtén datos de observabilidad en contexto directamente en las consolas de servicio de Google Kubernetes Engine, Cloud Run, Compute Engine y Anthos, y otros tiempos de ejecución. Recopila métricas, seguimientos y registros sin tener que configurar nada. La latencia de transferencia inferior a un segundo y la tasa de transferencia de terabytes por segundo garantizan que puedas realizar la administración y análisis de registros en tiempo real y a gran escala.
Si necesitas más ayuda práctica durante el recorrido, tenemos servicios adicionales que puedes considerar, incluidos los servicios de consultoría de Google. Comunícate con el departamento de Ventas para ver qué opción funcionaría en tu organización. Obtén información de nuestro equipo de CRE y las historias de éxito de clientes para conocer cómo las herramientas y prácticas de Google Cloud ayudaron a otras empresas a implementar SRE en su organización.
Con los paquetes de OpenTelemetry (OT) y Google Exporter, los desarrolladores pueden instrumentar y exportar datos de seguimiento a Cloud Trace. Nuestro nuevo Agente de operaciones unificado (en versión preliminar) recopila métricas y registros, y también admite OpenTelemetry para capturar y transportar métricas. Estamos trabajando para implementar bibliotecas de OT como funciones listas para usar en muchos de nuestros productos de nube. Cloud SQL Insights es un ejemplo de esta iniciativa.
Clientes
Documentación
Accede a los libros de SRE, escucha a expertos en SRE y descubre cómo aplicamos la SRE en Google.
Para supervisar un servicio, necesitas al menos un objetivo de nivel de servicio (SLO). Aprende paso a paso a crear tu primer SLO en Cloud Monitoring.
Aprende a definir y defender tus SLO en la observabilidad de Google Cloud y a mejorar la observabilidad de las aplicaciones que se ejecutan en Google Cloud.
En este curso, se enseña la teoría de los objetivos de nivel de servicio (SLO), un enfoque honesto para describir y medir la confiabilidad deseada de un servicio.
En este curso se presentan las prácticas clave de la SRE de Google y la función importante que tienen los líderes empresariales y de TI en el éxito de la adopción organizacional de este enfoque.
Novedades
Regístrate para recibir los boletines informativos de Google Cloud con información sobre actualizaciones de productos, eventos, ofertas especiales y mucho más.
Dinos en qué estás trabajando. Un experto de Google Cloud te ayudará a encontrar la mejor solución.