En esta sección del framework de arquitectura de Google Cloud, se muestra cómo diseñar y operar servicios confiables en una plataforma en la nube. También aprenderás sobre algunos de los productos y las funciones de Google Cloud que admiten la confiabilidad.
El framework de arquitectura describe las prácticas recomendadas, proporciona recomendaciones de implementación y explica algunos de los productos y servicios disponibles. Este framework busca ayudarte a diseñar la implementación de Google Cloud que mejor se adapte a las necesidades de tu empresa.
Para ejecutar un servicio confiable, la arquitectura debe incluir lo siguiente:
- Objetivos de confiabilidad medibles, con desviaciones que corriges de inmediato
- Patrones de diseño para la escalabilidad, la alta disponibilidad, la recuperación ante desastres y la administración automatizada de cambios.
- Componentes que se reparan siempre que sea posible y código que incluye instrumentación para la observabilidad
- Procedimientos operativos que ejecutan el servicio con un mínimo de trabajo manual y carga cognitiva en los operadores, y que te permiten detectar y mitigar con rapidez las fallas
La confiabilidad es responsabilidad de todos los ingenieros, como los equipos de desarrollo, administración de productos, operaciones y, también, ingeniería de confiabilidad de sitios (SRE). Todos deben ser responsables y comprender los objetivos de confiabilidad de su aplicación, así como los porcentajes de error aceptable y de riesgo. Los equipos deben poder priorizar el trabajo de forma adecuada y aumentar los conflictos de prioridad entre la confiabilidad y el desarrollo de las funciones del producto.
En la categoría de confiabilidad del framework de arquitectura, aprenderás a hacer lo siguiente:
- Comprende los principios básicos de confiabilidad
- Define tus objetivos de confiabilidad
- Adopta SLOs
- Genera observabilidad en tu infraestructura y aplicaciones
- Diseño para gran escala y alta disponibilidad
- Crea herramientas y procesos operativos confiables.
- Crea alertas eficientes.
- Compila un proceso colaborativo de administración de incidentes