La infraestructura confiable es un requisito fundamental para las cargas de trabajo en la nube. Como Cloud Architect, para diseñar una infraestructura confiable en tus cargas de trabajo, debes tener una buena comprensión de las capacidades de confiabilidad del proveedor de servicios en la nube que elijas. En este documento, se describen los componentes básicos de la confiabilidad en Google Cloud (zonas, regiones y recursos con alcance de ubicación) y los niveles de disponibilidad que proporcionan. También se proporcionan lineamientos para evaluar los requisitos de confiabilidad de las cargas de trabajo y se presentan recomendaciones de arquitecturas para crear y administrar infraestructuras confiables en Google Cloud.
Este documento se divide en las siguientes partes:
- Descripción general de la confiabilidad (esta parte)
- Componentes básicos de confiabilidad en Google Cloud
- Evalúa los requisitos de confiabilidad de las cargas de trabajo en la nube
- Diseña una infraestructura confiable para tus cargas de trabajo en Google Cloud
- Administra el tráfico y la carga de las cargas de trabajo en Google Cloud
- Administra y supervisa tu infraestructura de Google Cloud
Si ya leíste esta guía y necesitas un resumen de los cambios, consulta la sección Registro de cambios.
Descripción general de la confiabilidad
Una aplicación o carga de trabajo es confiable cuando cumple con tus objetivos actuales para la disponibilidad y la resiliencia ante fallas.
La disponibilidad (o tiempo de actividad) es el porcentaje de tiempo en que se puede usar una aplicación. Por ejemplo, para una aplicación que tiene un objetivo de disponibilidad del 99.99%, el tiempo de inactividad total no debe exceder los 8.64 segundos durante un período de 24 horas. A veces, la disponibilidad se mide como la proporción de solicitudes que la aplicación entrega de forma correcta durante un período determinado. Por ejemplo, en el caso de una aplicación que tiene un objetivo de disponibilidad del 99.99%, por cada 100,000 solicitudes recibidas, no pueden fallar más de diez. Por lo general, la disponibilidad se expresa como la cantidad de nueves en el porcentaje. Por ejemplo, la disponibilidad del 99.99% se expresa como “4 nueves”.
Según el propósito de la aplicación, puedes tener conjuntos diferentes de indicadores de qué tan confiable es la aplicación. A continuación, se muestran ejemplos de estos indicadores de confiabilidad:
- En las aplicaciones que entregan contenido, la disponibilidad, la latencia y la capacidad de procesamiento son indicadores importantes de confiabilidad. Indican si la aplicación puede responder a las solicitudes, cuánto tiempo tarda la aplicación en responder a las solicitudes y cuántas solicitudes puede procesar de forma correcta en un período determinado.
- Para las bases de datos y los sistemas de almacenamiento, la latencia, la capacidad de procesamiento, la disponibilidad y la durabilidad (lo bien están protegidos los datos contra la pérdida o la corrupción) son indicadores de confiabilidad. Indican cuánto tiempo el sistema tarda en leer o escribir datos y si se puede acceder a los datos a pedido.
- Para cargas de trabajo de macrodatos y estadísticas, como canalizaciones de procesamiento de datos, el rendimiento de la canalización coherente (capacidad de procesamiento y latencia) es esencial a fin de garantizar la actualización de los productos de datos y es un indicador de confiabilidad importante. Indica cuántos datos se pueden procesar y cuánto tiempo tarda la canalización en pasar de la transferencia de datos al procesamiento de ellos.
- La mayoría de las aplicaciones tienen la precisión de los datos como indicador de confiabilidad esencial.
Si deseas conocer más lineamientos sobre la definición de objetivos de confiabilidad para tus aplicaciones, consulta Evalúa los requisitos de confiabilidad para tus cargas de trabajo en la nube.
Factores que afectan la confiabilidad de la app
La confiabilidad de una aplicación que se implementa en Google Cloud depende de los siguientes factores:
- El diseño interno de la aplicación
- Las aplicaciones o los componentes secundarios de los que depende la aplicación
- Los recursos de infraestructura de Google Cloud, como el procesamiento, las herramientas de redes, el almacenamiento, las bases de datos y la seguridad en los que se ejecuta la aplicación, y cómo la aplicación usa la infraestructura
- La capacidad de infraestructura que aprovisionas y cómo se escala
- Los procesos y herramientas de DevOps que usas para compilar, implementar y mantener la aplicación, sus dependencias y la infraestructura de Google Cloud
Estos factores se resumen en el siguiente diagrama:
Como se muestra en el diagrama anterior, la confiabilidad de una aplicación que se implementa en Google Cloud depende de varios factores. El enfoque de esta guía es la confiabilidad de la infraestructura de Google Cloud.
¿Qué sigue?
- Componentes básicos de confiabilidad en Google Cloud
- Evalúa los requisitos de confiabilidad de las cargas de trabajo en la nube
- Diseña una infraestructura confiable para tus cargas de trabajo en Google Cloud
- Administra el tráfico y la carga de las cargas de trabajo en Google Cloud
- Administra y supervisa la infraestructura de Google Cloud
Colaboradores
Autores:
- Nir Tarcic | SRE UTL de Cloud Lifecycle
- Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
Otros colaboradores:
- Alok Kumar | Ingeniero distinguido
- Andrew Fikes | Experto en Ingeniería, Confiabilidad
- Chris Heiser | TL de SRE
- David Ferguson | Director, Ingeniería de Confiabilidad de Sitios
- Joe Tan | Asesor sénior de Productos
- Krzysztof Duleba | Ingeniero principal
- Narayan Desai | SRE principal
- Sailesh Krishnamurthy | Vicepresidente, Ingeniería
- Steve McGhee | Defensor de Confiabilidad
- Sudhanshu Jain | Gerente de producto
- Yaniv Aknin | Ingeniero de software