Descarga el nuevo informe sobre SRE para conocer los conceptos clave y cómo Google Cloud puede ayudarte en tu viaje a través de SRE
Ir a

Site Reliability Engineering (SRE)

SRE es una función para los puestos de trabajo, una mentalidad y un conjunto de prácticas de ingeniería para ejecutar sistemas de producción fiables. Google Cloud te ayuda a aplicar los principios de SRE a través de herramientas, servicios profesionales y otros recursos.
  • Sabre
  • Lowe’s
  • adeo
  • Zebra
  • Optiva
  • Proctor & Gamble
  • TELUS
  • Ulta
  • Logotipo de JCB

Ventajas

Equilibra la velocidad y la fiabilidad

Aprovecha las ventajas que ofrece la velocidad

Automatiza todo el proceso, desde la escritura del código hasta la ejecución de servicios en producción. Ajusta los objetivos de desarrollo y las operaciones a las metas compartidas para acelerar el proceso. Conéctate a las herramientas que más te gustan, incluida la gestión de incidentes, para reducir los esfuerzos.

Mejora la fiabilidad con los principios de SRE de eficacia demostrada

Aprovecha los principios de SRE desarrollados en Google y que han demostrado funcionar a escala. Implementa fácilmente las prácticas recomendadas de SRE con la suite de operaciones de Google Cloud  para acelerar la resolución de problemas y mejorar la fiabilidad.

Te ayudamos en tu proceso de SRE

Disfruta de un mayor envío de software, independientemente del tamaño de tu empresa, del sector en el que trabajes o de si usas máquinas virtuales, Kubernetes o sin servidor. Elige entre las herramientas gratuitas u ofertas de pago para poner en marcha tu experiencia de SRE.

Características principales

Herramientas y recursos de SRE para mejorar las operaciones y los equipos de SRE

Monitoriza el estado de los servicios mediante los principios de SRE

Monitoriza el estado de tus servicios y trabaja con desarrolladores para aumentar la velocidad de los cambios gracias a la compatibilidad integrada de la monitorización de los servicios. Selecciona las métricas de los SLI, define los objetivos de nivel de servicio y monitoriza los presupuestos de los errores para mitigar los riesgos de tu servicio. Utiliza potentes paneles de control para añadir métricas y registros, incluidas señales doradas para reducir el MTTR y responde rápidamente a preguntas sobre el estado del servicio.

Integración preconfigurada para aumentar la automatización y reducir el esfuerzo

Utiliza nuestras integraciones integradas con las herramientas que te encantan para solucionar rápidamente los incidentes. Implementa lanzamientos progresivos y restaura cambios de forma segura. Utiliza las integraciones predefinidas con Cloud Build para compilar, probar y desplegar artefactos en Google Kubernetes Engine, App Engine, Cloud Functions, Firebase y Cloud Run como parte de tu CI/CD.

Una vista integrada para una resolución más rápida

Obtén una vista unificada de los registros, los eventos, las métricas y los objetivos de nivel de servicio. Consigue datos de observación en contexto directamente desde las consolas de servicio de Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos y otros entornos de ejecución. Obtén métricas, trazas y registros sin que tengas que configurar nada. Gracias a la latencia de ingestión de menos de un segundo y a la velocidad de ingestión de terabytes por segundo, puedes realizar tareas de gestión y análisis de registros en tiempo real y a escala. 

Obtén ayuda adicional de los especialistas en SRE de Google Cloud

Si necesitas más ayuda práctica durante el proceso, te recomendamos que utilices los servicios de consultoría de Google. Ponte en contacto con el equipo de Ventas para saber qué opción es la más adecuada para tu organización. Consigue más información sobre nuestro equipo de CRE y los casos de éxito de nuestros clientes sobre cómo las herramientas y prácticas de Google Cloud han ayudado a otras empresas a implementar esta solución en su organización.

Impulsa la colaboración SRE/Desarrollador hacia la observabilidad con el enfoque shift-left aplicado

Con los paquetes de OpenTelemetry (OT) y Google Exporter, los desarrolladores pueden instrumentar y exportar datos de trazas a Cloud Trace. Nuestro nuevo agente de operaciones (en la vista previa) recopila métricas y registros, y es compatible con OpenTelemetry, lo que te permite capturar y transportar métricas. Estamos trabajando para implementar bibliotecas de OT como funciones que estén listas para usarse en muchos de nuestros productos en la nube. Cloud SQL Insights es un ejemplo de los esfuerzos que estamos haciendo para lograrlo.


Documentación

Descubre cómo implementar la SRE en la organización con estos recursos

Práctica recomendada
Site Reliability Engineering de Google

Accede a los libros de SRE, aprende sobre RSE y descubre cómo ofrecemos SRE en Google.

Aspectos básicos de Google Cloud
Crear un acuerdo de nivel de servicio

Para monitorizar un servicio, debes tener al menos un objetivo de nivel de servicio. Descubre cómo crear tu primer objetivo de nivel de servicio en Cloud Monitoring.

Tutorial
Ingeniería para la fiabilidad

Aprende cómo definir y proteger tus objetivos de nivel de servicio en la suite de operaciones de Google Cloud y mejora la observabilidad de las aplicaciones que se ejecutan en Google Cloud.

Tutorial
SRE: Medir y gestionar la fiabilidad

En este curso aprenderás cómo funciona la teoría de objetivos de nivel de servicio, una de las principales formas de describir y medir la fiabilidad de los servicios.

Tutorial
Desarrollar una cultura de SRE de Google

En este curso se presentan las prácticas clave de SRE de Google y el importante papel que desempeñan los responsables de TI y de negocio en la adopción de la organización.

Novedades

Novedades de Google Cloud Platform

Suscríbete para recibir newsletters de Google Cloud con novedades sobre productos, información de eventos, ofertas especiales y mucho más.