Ingeniería de confiabilidad de sitios (SRE)
Beneficios
Logra un equilibrio entre velocidad y confiabilidad
Aprovecha los beneficios de la velocidad
Automatiza de extremo a extremo, desde la escritura de código hasta la ejecución de servicios en producción. Alinea el desarrollo y las operaciones en torno a los objetivos compartidos para ir más rápido. Conéctate con tus herramientas preferidas, incluida la administración de incidentes, a medida que minimizas el trabajo manual.
Mejora la confiabilidad con principios de SRE comprobados
Aprovecha los principios de la SRE que se desarrollaron en Google y que demostraron funcionar a gran escala. Implementa con facilidad las prácticas recomendadas de SRE con Google Cloud's operations suite para acelerar la resolución de problemas y mejorar la confiabilidad.
Estamos disponibles para ayudarte en las etapas de tu recorrido hacia la SRE
Impulsa una entrega de software más alta, sin importar el tamaño de la empresa, la industria o si usas VMs, Kubernetes o sin servidores. Elige entre ofertas pagadas y herramientas pagadas para poner en marcha tu recorrido de SRE.
Características clave
Herramientas y recursos de SRE para mejorar el funcionamiento de tus operaciones y equipos de SRE
Supervisa el estado de los servicios con principios de SRE
Supervisa el estado de los servicios y trabaja con los desarrolladores para aumentar la velocidad de los cambios mediante la asistencia integrada de la supervisión de servicios. Selecciona métricas para SLI, configura SLO y haz un seguimiento de los porcentajes de error aceptables a fin de mitigar el riesgo para tu servicio. Usa herramientas potentes de paneles de control para agregar métricas y registros, incluidas señales de oro para reducir MTTR y responder preguntas sobre el estado del servicio con rapidez.
Integraciones listas para usar que aumentan la automatización y reducen el trabajo manual
Usa nuestras integraciones integradas con las herramientas que te gustan para solucionar problemas con rapidez. Implementa lanzamientos progresivos y revierte los cambios de forma segura. Las integraciones ya compiladas con Cloud Build están disponibles para permitirte compilar, probar y, también, implementar artefactos en Google Kubernetes Engine, App Engine, Cloud Functions, Firebase y Cloud Run como parte de tu IC/EC.
Una vista integrada para una resolución más rápida
Obtén una vista unificada de registros, eventos, métricas y SLO. Obtén datos de observabilidad en contexto directamente en las consolas de servicio de Google Kubernetes Engine, Cloud Run, Compute Engine y Anthos, y otros tiempos de ejecución. Recopila métricas, seguimientos y registros sin tener que configurar nada. La latencia de transferencia inferior a un segundo y la tasa de transferencia de terabytes por segundo garantizan que puedas realizar la administración y análisis de registros en tiempo real y a gran escala.
Obtén ayuda adicional de los especialistas de SRE de Google Cloud
Si necesitas más ayuda práctica durante el recorrido, tenemos servicios adicionales que puedes considerar, incluidos los servicios de consultoría de Google. Comunícate con el departamento de Ventas para ver qué opción funcionaría en tu organización. Obtén información de nuestro equipo de CRE y las historias de éxito de clientes para conocer cómo las herramientas y prácticas de Google Cloud ayudaron a otras empresas a implementar SRE en su organización.
Impulsa la colaboración de SRE/desarrolladores hacia la observabilidad de mayores medidas de seguridad.
Con los paquetes de OpenTelemetry (OT) y Google Exporter, los desarrolladores pueden instrumentar y exportar datos de seguimiento a Cloud Trace. Nuestro nuevo agente de operaciones unificado (en vista previa) recopila métricas y registros, y también admite OpenTelemetry para capturar y transportar métricas. Estamos trabajando para implementar bibliotecas de OT como funciones listas para usar en muchos de nuestros productos de nube. Cloud SQL Insights es un ejemplo de esta iniciativa.
Servicios relacionados
Integraciones y productos de SRE
Compila e implementa nuevas aplicaciones en la nube, almacena artefactos y supervisa la seguridad y confiabilidad de las apps en Google Cloud.
Documentación
Aprende a implementar SRE en tu organización con estos recursos
Ingeniería de confiabilidad de sitios de Google
Accede a los libros de SRE, descubre y aprende cómo hacemos la SRE en Google.
Crea un SLO
Para supervisar un servicio, necesitas al menos un objetivo de nivel de servicio (SLO). Aprende paso a paso cómo crear tu primer SLO en Cloud Monitoring.
Ingeniería para la confiabilidad
Descubre cómo definir y defender tus SLO en Google Cloud's operations suite y mejorar la observabilidad de las aplicaciones que se ejecutan en Google Cloud.
SRE: Medición y administración de la confiabilidad
En este curso, se enseña la teoría de los objetivos de nivel de servicio (SLO), una forma honesta de describir y medir la confiabilidad deseada de un servicio.
Developing a Google SRE culture
En este curso se presentan las prácticas clave de la SRE de Google y la función importante que tienen los líderes empresariales y de TI en el éxito de la adopción organizacional de este enfoque.
Novedades de Google Cloud SRE
Regístrate para recibir los boletines informativos de Google Cloud con información sobre actualizaciones de productos, eventos, ofertas especiales y mucho más.