Descarga el nuevo informe sobre SRE para conocer los conceptos clave y cómo Google Cloud puede ayudarte en tu recorrido a SRE
Ir a

Ingeniería de confiabilidad de sitios (SRE)

La SRE es una función de trabajo, una mentalidad y un conjunto de prácticas de ingeniería para ejecutar sistemas de producción confiables. Google Cloud te ayuda a implementar los principios de la SRE a través de herramientas, servicios profesionales y otros recursos.
  • Sabre
  • Lowe’s
  • adeo
  • Zebra
  • Optiva
  • Procter & Gamble
  • TELUS
  • Ulta
  • Logotipo de JCB

Ventajas

Logra un equilibrio entre velocidad y confiabilidad

Aprovecha los beneficios de la velocidad

Automatiza de extremo a extremo, desde la escritura de código hasta la ejecución de servicios en producción. Alinea el desarrollo y las operaciones en torno a los objetivos compartidos para ir más rápido. Conéctate con tus herramientas preferidas, incluida la administración de incidentes, a medida que minimizas el trabajo manual.

Mejora la confiabilidad con principios de SRE comprobados

Aprovecha los principios de la SRE que se desarrollaron en Google y que demostraron funcionar a gran escala. Implementa con facilidad las prácticas recomendadas de SRE con Google Cloud's operations suite para acelerar la resolución de problemas y mejorar la confiabilidad.

Estamos disponibles para ayudarte en las etapas de tu recorrido hacia la SRE

Impulsa una entrega de software más alta, sin importar el tamaño de la empresa, la industria o si usas VMs, Kubernetes o sin servidores. Elige entre ofertas pagadas y herramientas pagadas para poner en marcha tu recorrido de SRE.

Características clave

Herramientas y recursos de SRE para mejorar el funcionamiento de tus operaciones y equipos de SRE

Supervisa el estado de los servicios con principios de SRE

Supervisa el estado de los servicios y trabaja con los desarrolladores para aumentar la velocidad de los cambios mediante la asistencia integrada de la supervisión de servicios. Selecciona métricas para SLI, configura SLO y haz un seguimiento de los porcentajes de error aceptables a fin de mitigar el riesgo para tu servicio. Usa herramientas potentes de paneles de control para agregar métricas y registros, incluidas señales de oro para reducir MTTR y responder preguntas sobre el estado del servicio con rapidez.

Integraciones listas para usar que aumentan la automatización y reducen el trabajo manual

Usa nuestras integraciones integradas con las herramientas que te gustan para solucionar problemas con rapidez. Implementa lanzamientos progresivos y revierte los cambios de forma segura. Las integraciones ya compiladas con Cloud Build están disponibles para permitirte compilar, probar y, también, implementar artefactos en Google Kubernetes Engine, App Engine, Cloud Functions, Firebase y Cloud Run como parte de tu IC/EC.

Una vista integrada para una resolución más rápida

Obtén una vista unificada de registros, eventos, métricas y SLO. Obtén datos de observabilidad en contexto directamente en las consolas de servicio de Google Kubernetes Engine, Cloud Run, Compute Engine y Anthos, y otros tiempos de ejecución. Recopila métricas, seguimientos y registros sin tener que configurar nada. La latencia de transferencia inferior a un segundo y la tasa de transferencia de terabytes por segundo garantizan que puedas realizar la administración y análisis de registros en tiempo real y a gran escala.

Obtén ayuda adicional de los especialistas de SRE de Google Cloud

Si necesitas más ayuda práctica durante el recorrido, tenemos servicios adicionales que puedes considerar, incluidos los servicios de consultoría de Google. Comunícate con el departamento de Ventas para ver qué opción funcionaría en tu organización. Obtén información de nuestro equipo de CRE y las historias de éxito de clientes para conocer cómo las herramientas y prácticas de Google Cloud ayudaron a otras empresas a implementar SRE en su organización.

Impulsa la colaboración de SRE/desarrolladores hacia la observabilidad de mayores medidas de seguridad.

Con los paquetes de OpenTelemetry (OT) y Google Exporter, los desarrolladores pueden instrumentar y exportar datos de seguimiento a Cloud Trace. Nuestro nuevo agente de operaciones unificado (en vista previa) recopila métricas y registros, y también admite OpenTelemetry para capturar y transportar métricas. Estamos trabajando para implementar bibliotecas de OT como funciones listas para usar en muchos de nuestros productos de nube. Cloud SQL Insights es un ejemplo de esta iniciativa.


Documentación

Aprende a implementar SRE en tu organización con estos recursos

Práctica recomendada
Ingeniería de confiabilidad de sitios de Google

Accede a los libros de SRE, descubre y aprende cómo hacemos la SRE en Google.

Conceptos básicos de Google Cloud
Crea un SLO

Para supervisar un servicio, necesitas al menos un objetivo de nivel de servicio (SLO). Aprende paso a paso cómo crear tu primer SLO en Cloud Monitoring.

Instructivo
Ingeniería para la confiabilidad

Descubre cómo definir y defender tus SLO en Google Cloud's operations suite y mejorar la observabilidad de las aplicaciones que se ejecutan en Google Cloud.

Instructivo
SRE: Medición y administración de la confiabilidad

En este curso, se enseña la teoría de los objetivos de nivel de servicio (SLO), una forma honesta de describir y medir la confiabilidad deseada de un servicio.

Instructivo
Developing a Google SRE culture

En este curso se presentan las prácticas clave de la SRE de Google y la función importante que tienen los líderes empresariales y de TI en el éxito de la adopción organizacional de este enfoque.

Novedades

Novedades de Google Cloud SRE

Regístrate para recibir los boletines informativos de Google Cloud con información sobre actualizaciones de productos, eventos, ofertas especiales y mucho más.