En este documento, se proporciona información para proteger los datos de tu aplicación en un universo de varias zonas aislado de Internet de Google Distributed Cloud (GDC). Para mantener aplicaciones con alta disponibilidad, puedes implementar una estrategia de protección de datos que sea resiliente a las interrupciones o fallas locales. GDC proporciona estrategias de replicación de datos para el almacenamiento de objetos y el almacenamiento de bloques para que puedas mantener procedimientos de conmutación por error para las zonas principales y secundarias de tu universo.
Este documento está dirigido a los administradores de TI que forman parte del grupo de administradores de la plataforma y que son responsables de desarrollar flujos de trabajo de recuperación ante desastres, y a los desarrolladores de aplicaciones que forman parte del grupo de operadores de aplicaciones y que son responsables de desarrollar y mantener aplicaciones en un universo de GDC.
Para obtener más información, consulta Audiences for GDC air-gapped documentation.
Replicación de almacenamiento para la recuperación ante desastres
Puedes configurar una protección de datos sólida para el almacenamiento de tu aplicación en un universo multizona con la replicación de datos asíncrona para la recuperación ante desastres. Este enfoque implica copiar datos de una zona principal a una secundaria en intervalos periódicos. Este mecanismo mantiene tus datos protegidos y accesibles si la zona principal experimenta una interrupción.
La replicación de datos para el almacenamiento de objetos usa buckets de zona doble para replicar automáticamente tus datos y no requiere intervención manual. Para obtener más información sobre cómo crear un bucket de zona doble, consulta Crea buckets de almacenamiento.
La replicación de datos para el almacenamiento en bloque usa volúmenes persistentes de zona doble para replicar tus datos y requiere un procedimiento de conmutación por error del volumen. Para obtener más información, consulta Cómo replicar volúmenes de forma asíncrona.
Después de configurar la replicación de datos, estos siguen un procedimiento de conmutación por error cuando la zona principal está sin conexión. Los procedimientos de conmutación por error son distintos para la replicación del almacenamiento de objetos y de bloques. Sin embargo, ambas estrategias de replicación de datos utilizan los siguientes pasos críticos:
- Verifica la interrupción de la zona principal.
- Detén la replicación desde la zona principal.
- Promueve la zona secundaria de copia de seguridad para que asuma el rol de zona principal con intervención manual o una conmutación por error preconfigurada.
- Verifica el estado operativo de la nueva zona principal.
Comunícate con un miembro del grupo de operadores de infraestructura para confirmar que tus dos zonas estén configuradas para la replicación de datos asíncrona.
La demora inherente que conlleva la replicación de datos asíncrona significa que esta configuración es más útil para los sistemas que requieren un objetivo de punto de recuperación (RPO) bajo, pero no nulo. Si tu sistema requiere una pérdida de datos mínima, pero puede tolerar una pequeña cantidad máxima predefinida de pérdida de datos medida en tiempo, que suele estar relacionada con los datos generados inmediatamente antes de un evento de desastre que podría ser potencialmente irrecuperable, la replicación de datos asíncrona es una función valiosa para implementar en tus aplicaciones.
Un ejemplo de un RPO bajo no nulo podría ser una plataforma de operaciones financieras con un RPO de cinco minutos, en la que la replicación de datos asíncrona se configura para copiar los datos de operaciones en una zona secundaria de recuperación ante desastres cada dos minutos:
- Este es un caso de RPO bajo, ya que los cinco minutos representan el período mínimo aceptable de pérdida de datos para el sistema de gran volumen.
- Es una situación de RPO distinto de cero porque la demora inherente en la replicación asíncrona de intervalos de dos minutos significa que hay un pequeño período en el que los datos aún no se copiaron, lo que genera una posible pérdida.
Debes trabajar con tu grupo de operadores de infraestructura para definir tu flujo de trabajo de replicación de almacenamiento asíncrono de doble zona y verificar que las capacidades de replicación de datos de la infraestructura admitan tus requisitos de RPO.
¿Qué sigue?
- Alta disponibilidad para tus apps
- Implementa una aplicación de VM con alta disponibilidad
- Implementa una aplicación en contenedores con alta disponibilidad