Acerca de Persistent Disks regional


Persistent Disk regional es una opción de almacenamiento que te permite implementar servicios de alta disponibilidad (HA) en Compute Engine. Los Persistent Disks regionales replican datos de forma síncrona entre dos zonas de la misma región y garantizan la alta disponibilidad para los datos de disco hasta una falla zonal.

Los volúmenes de Persistent Disk regional están diseñados para cargas de trabajo que requieren un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) más bajos. Para obtener más información sobre RPO y RTO, consulta Conceptos básicos de la planificación de recuperación ante desastres.

Los volúmenes de Persistent Disk regional también están diseñados para funcionar con grupos de instancias administrados regionales.

En este documento, se proporciona una descripción general sobre Persistent Disk regional y cómo puedes usar un volumen de Persistent Disk regional para compilar servicios de alta disponibilidad.

Cuando decidas usar Persistent Disk regional, asegúrate de comparar las diferentes opciones para aumentar la disponibilidad del servicio y el costo, el rendimiento y la resiliencia de arquitecturas de servicios diferentes.

Replicación de discos zonales para Persistent Disks regionales

Un volumen de Persistent Disk regional tiene una zona principal y una secundaria dentro de su región en la que se almacenan los datos del disco:

  • La zona principal es la misma zona de la instancia de máquina virtual (VM) a la que conectaste el disco.
  • La zona secundaria es una zona alternativa de tu elección dentro de la misma región.

Compute Engine mantiene réplicas del volumen de Persistent Disk regional en ambas zonas. Cuando escribes datos en tu disco, Compute Engine replica de forma síncrona esos datos en las réplicas de disco en ambas zonas para garantizar la alta disponibilidad. Los datos de cada réplica zonal se distribuyen en varias máquinas físicas dentro de la zona para garantizar la durabilidad. Las réplicas zonales garantizan que los datos del volumen de Persistent Disk permanezcan disponibles y proporcionan protección contra interrupciones temporales en una de las zonas de discos.

Estado de la réplica para réplicas zonales

El estado de la réplica del disco para Persistent Disk regional te muestra el estado de una réplica zonal en comparación con el contenido del disco. Las réplicas zonales para tu Persistent Disk regional se encuentran en uno de los siguientes estados de réplica de disco en todo momento:

  • Sincronizada: la réplica está disponible, recibe de forma síncrona todas las escrituras realizadas en el disco y está actualizada con todos los datos en el disco.
  • Actualizándose: La réplica está disponible, pero se actualiza con los datos del disco de la otra réplica.
  • Sin sincronizar: La réplica no está disponible temporalmente y no está sincronizada con los datos del disco.

Para obtener información sobre cómo verificar y hacer un seguimiento de los estados de las réplicas de tus réplicas zonales, consulta Supervisa los estados de las réplicas de disco de los volúmenes de Persistent Disk regionales.

Estado de replicación de Persistent Disks regionales

Según el estado de las réplicas zonales individuales, el volumen de los Persistent Disks regionales puede estar en uno de los siguientes estados de replicación:

  • Replicación completa: Las réplicas en ambas zonas están disponibles y se sincronizan con los datos del disco más recientes.
  • Actualizándose. Tus réplicas zonales están disponibles, pero una de las réplicas zonales se pone al día con los datos del disco más reciente.
  • Degradada: Una de las réplicas zonales no está sincronizada debido a una falla o una interrupción.

Si tu volumen de Persistent Disk regional se está actualizando o está degradando, una de las réplicas zonales no se actualizará con todos los datos. Cualquier interrupción durante este tiempo en la zona de la réplica en buen estado da como resultado una falta de disponibilidad del volumen de Persistent Disk regional hasta que se restablezca la zona de réplica en buen estado.

Cuando el volumen del Persistent Disk regional se actualice, Google Cloud comenzará a reparar la réplica zonal que está en el estado Actualizándose. Google recomienda que esperes a que la réplica zonal afectada se actualice con los datos del disco. Luego, cuando la réplica zonal cambia al estado sincronizado, el volumen de Persistent Disk regional vuelve a un estado completamente replicado. Si el volumen de Persistent Disk regional se actualiza o se degrada durante un período prolongado y no cumple con los requisitos de RPO de tu organización, te recomendamos que tomes instantáneas de tu disco de cualquiera de las siguientes maneras:

  • Habilita las instantáneas programadas.
  • Crea una instantánea manual para el volumen de Persistent Disk regional.

Después de crear la instantánea, puedes crear un nuevo volumen de Persistent Disk regional con esa instantánea. Recupera tus datos en el volumen de Persistent Disk regional nuevo. El volumen nuevo también comienza en un estado completamente replicado con replicación de datos en buen estado.

Para obtener información sobre cómo verificar el estado de replicación de tu volumen de Persistent Disk regional, consulta Determina el estado de replicación de Persistent Disk regional.

Punto de control de recuperación de la réplica de Persistent Disks regionales

Un punto de control de recuperación de réplica es un atributo de Persistent Disk regional que representa el punto temporal coherente frente a las fallas más reciente de un disco completamente replicado. Compute Engine crea y mantiene de forma automática un solo punto de control de recuperación de réplica para cada volumen de Persistent Disk regional. Cuando un volumen de Persistent Disk regional se replica por completo, Compute Engine continúa actualizando su punto de control aproximadamente cada 10 minutos para garantizar que el punto de control permanezca actualizado. Cuando el volumen de Persistent Disk regional se degrada, Compute Engine te permite crear una instantánea estándar desde el punto de control de recuperación de la réplica de ese disco. La instantánea estándar resultante captura los datos de la versión más reciente coherente frente a fallas del disco completamente replicado.

En raras ocasiones, cuando tu disco se degrada, la réplica zonal que se sincroniza con los datos del disco más reciente también puede fallar antes de que la réplica desincronizada se actualice. No podrás forzar la conexión del disco a las VM de ninguna zona. El volumen de Persistent Disk regional deja de estar disponible y debes migrar los datos a un disco nuevo. En esas situaciones, si no tienes ninguna instantánea estándar disponible para tu disco, es posible que puedas recuperar los datos del disco desde la réplica incompleta mediante una instantánea estándar creada a partir de una instantánea estándar. punto de control de recuperación de réplicas.

Compute Engine crea automáticamente puntos de control de recuperación de réplica para cada volumen de Persistent Disk regional activado. No se generan cargos adicionales por la creación de estos puntos de control. Sin embargo, se generan cargos de almacenamiento aplicables por la creación de instantáneas y VMs cuando usas estos puntos de control para migrar tu disco a zonas que funcionen.

Obtén más información sobre cómo recuperar tus datos regionales de Persistent Disk con un punto de control de recuperación de réplicas.

Conmutación por error de Persistent Disks regionales

Si se produce una interrupción en una zona, esta se vuelve inaccesible y la VM de esa zona no puede realizar operaciones de lectura o escritura en su disco. Para permitir que la VM siga realizando operaciones de lectura y escritura en el disco, Compute Engine permite la migración de datos del disco a la otra zona en la que el disco tiene una réplica. Este proceso se llama conmutación por error regional de Persistent Disk. El proceso de conmutación por error implica desconectar la VM de la réplica del disco en la zona afectada y, luego, volver a conectar una VM nueva a la réplica del disco en la otra zona. Compute Engine replica de forma síncrona los datos en tu disco en la región secundaria para garantizar una conmutación por error rápida en caso de que falle una sola réplica.

Conmutación por error por el plano de control regional específico de la aplicación

El plano de control regional específico de la aplicación no es un servicio de Google Cloud. Cuando diseñas arquitecturas de servicios de HA, debes compilar tu propio plano de control regional específico de la aplicación. Este plano de control de la aplicación decide qué VM debe tener el Persistent Disk regional conectado y qué VM es la VM principal actual. Cuando se detecta una falla en la VM principal o la base de datos del volumen de Persistent Disk regional, el plano de control regional específico de la aplicación de la arquitectura de servicio de alta disponibilidad puede iniciar la conmutación por error automáticamente a la VM en espera en la secundaria. zona. Durante la conmutación por error, el plano de control regional específico de la aplicación vuelve a conectar el volumen de Persistent Disk regional a la VM en espera en la zona secundaria. Luego, Compute Engine dirige todo el tráfico a esa VM en función de los indicadores de la verificación de estado.

La latencia general de la conmutación por error, que excluye el tiempo de detección de fallas, es la suma de las siguientes latencias:

  • Cero segundos para volver a conectar un volumen de Persistent Disk regional a una VM en espera
  • Tiempo necesario para la inicialización de la aplicación y la recuperación ante fallas

Para obtener más información, consulta Comprende el plano de control regional específico de la aplicación.

En la página Componentes básicos para la recuperación ante desastres, se describen los componentes disponibles en la actualidad en Compute Engine.

Conmutación por error por conexión forzada

Uno de los beneficios de Persistent Disk regional es que, en el improbable caso de una interrupción zonal, también puedes conmutar por error de forma manual tu carga de trabajo que se ejecuta en Persistent Disk a otra zona. Cuando la zona original tiene una interrupción, no puedes completar la operación de desconexión hasta que se restablezca esa réplica zonal. En esta situación, es posible que debas conectar la VM nueva a la réplica zonal secundaria sin desconectar la VM de la réplica zonal principal. Este proceso se denomina conexión forzada.

Cuando tu instancia de VM en la zona principal deja de estar disponible, puedes forzar la conexión del disco a una instancia de VM en la zona secundaria. Para llevar a cabo esta tarea, debes realizar una de las siguientes acciones:

  • Iniciar otra instancia de VM en la misma zona que el volumen de Persistent Disk regional cuya conexión estás forzando.
  • Mantener una instancia de VM en espera activa en esa zona. Una instancia de VM en espera activa es una instancia de VM en ejecución que es idéntica a la que usas. Las dos instancias tienen los mismos datos.

Compute Engine ejecuta la operación de conexión forzada en menos de un minuto. El objetivo de tiempo de recuperación (RTO) total no solo depende de la conmutación por error del almacenamiento (la conexión forzada del volumen del Persistent Disk regional), sino también de otros factores, incluidos los siguientes:

  • Si primero debes crear una instancia de VM secundaria
  • La cantidad de tiempo que el sistema de archivos subyacente detecta un disco conectado en caliente
  • El tiempo de recuperación de las aplicaciones correspondientes

Para obtener más información sobre cómo conmutar por error una VM mediante conexión forzada, consulta Conmuta por error tu volumen de Persistent Disk regional mediante force-attach.

El Persistent Disk regional favorece la disponibilidad de la carga de trabajo, lo que significa que hay compensaciones para la protección de datos en el caso improbable de que ambas réplicas de disco dejen de estar disponibles al mismo tiempo. A fin de obtener más información, consulta Administra fallas para Persistent Disk regional.

Limitaciones

En las siguientes secciones, se enumeran las limitaciones que se aplican a Persistent Disk regional.

Limitaciones generales para Persistent Disk regional

  • Solo puedes conectar el disco persistente regional a las VM que usan E2, N1, N2 y tipos de máquina N2D.
  • No puedes crear un Persistent Disk regional a partir de una imagen.
  • Cuando usas el modo de solo lectura, puedes conectar un disco persistente regional balanceado a un máximo de 10 instancias de VM.
  • El tamaño mínimo de un Persistent Disk estándar regional es de 200 GiB.
  • Solo puedes aumentar el tamaño de un volumen de Persistent Disk regional. no puedes disminuir su tamaño.
  • Los volúmenes de los discos persistentes regionales tienen características de rendimiento diferentes a los de los volúmenes zonales. Para obtener más información, consulta Rendimiento del almacenamiento en bloque.
  • Si creas un Persistent Disk regional mediante la clonación de un disco zonal, las dos réplicas zonales no están completamente sincronizadas en el momento de la creación. Después de la creación, puedes usar la clonación de disco regional en promedio en 3 minutos. Sin embargo, es posible que debas esperar decenas de minutos antes de que el disco alcance un estado completamente replicado y el objetivo de punto de recuperación (RPO) esté cerca de cero. Obtén información sobre cómo verificar si tu Persistent Disk regional está replicado por completo.

Limitaciones del punto de control de recuperación de la réplica de Persistent Disks regionales

  • Un punto de control de recuperación de réplica es parte de los metadatos del dispositivo y no muestra ningún dato del disco por sí mismo. Solo puedes usar el punto de control como un mecanismo para crear una instantánea del disco degradado. Después de crear la instantánea mediante el punto de control, puedes usar la instantánea para restablecer tus datos.
  • Puedes crear instantáneas desde un punto de control de recuperación de réplicas solo cuando tu disco está degradado.
  • Compute Engine actualiza el punto de control de la réplica de recuperación de tu disco solo cuando este se replica por completo.
  • Compute Engine solo mantiene un punto de control de recuperación de réplica para un disco y solo mantiene la versión más reciente de ese punto de control.
  • No puedes ver las marcas de tiempo de creación y actualización exactas de un punto de control de recuperación de réplicas.
  • Puedes crear una instantánea desde tu punto de control de recuperación de réplicas solo con la API de Compute Engine.

¿Qué sigue?