Descripción general de la copia de seguridad de Cassandra

La función de copia de seguridad y restablecimiento de Apigee Hybrid te permite crear copias de seguridad de los datos híbridos y, en casos de desastre, restablecer los datos a instantáneas de trabajo anteriores. La disponibilidad y la retención de las copias de seguridad se basan en la infraestructura de copias de seguridad que proporciones.

Una instalación típica de Apigee Hybrid consta de los siguientes componentes:

  • MART (servicio de administrador)
  • Controlador y agente de observación (administrar objetos de Kubernetes)
  • Istio (administra Ingress)
  • Entorno de ejecución, sincronización y UDCA (uno por entorno)
  • Telemetría (supervisión y registro)
  • Administrador de certificados (administra certificados)
  • Datastores (bases de datos de Cassandra y Redis)

Todos los componentes, excepto Cassandra, no tienen estado y no conservan ningún dato. La copia de seguridad y el restablecimiento no es necesaria para esos componentes. Durante la recuperación, la reinstalación de esos componentes mediante las anulaciones existentes es suficiente.

¿Por qué realizar copias de seguridad de Cassandra?

Las copias de seguridad son una medida importante de protección contra situaciones de desastre. Cada copia de seguridad actúa como una instantánea coherente de los datos de Cassandra existentes en el momento en que se crea la copia de seguridad. Además de los datos de Cassandra, esta instantánea incluye esquema y metadatos dentro del clúster de Cassandra. En caso de un desastre, las copias de seguridad te permiten restablecer la instancia híbrida a un estado operativo anterior. Según el tamaño de la instancia híbrida, un solo conjunto de copia de seguridad puede contener uno o más archivos de copia de seguridad.

¿Qué necesitas saber sobre las copias de seguridad de Cassandra?

Cassandra es una base de datos replicada que está configurada para tener al menos 3 copias de tus datos en cada región o centro de datos. Cassandra usa la replicación de transmisión y las reparaciones de lectura para mantener las réplicas de datos en cada región o el centro de datos en un momento determinado.

En la nube híbrida, las copias de seguridad de Cassandra no están habilitadas de forma predeterminada. Se recomienda habilitar las copias de seguridad de Cassandra en caso de que los datos se pierdan ante una falla catastrófica. Las copias de seguridad de Cassandra están diseñadas para su uso en casos de recuperación ante desastres y no para la pérdida de datos causada por la eliminación accidental.

Las copias de seguridad se crean según el programa establecido en el archivo overrides.yaml. Una vez que se aplica una programación de copia de seguridad a tu clúster híbrido, se ejecuta un trabajo de copia de seguridad de Kubernetes de acuerdo con la programación. El trabajo activa una secuencia de comandos de copia de seguridad en cada nodo de Cassandra en tu clúster híbrido que recopila todos los datos en el nodo, crea un archivo de datos y envía el archivo a Cloud Storage o a un directorio en un servidor remoto.

¿Qué elementos tiene una copia de seguridad?

La copia de seguridad híbrida es una copia de seguridad completa de los datos de entorno de ejecución persistentes almacenados en Cassandra de Apigee en el momento de la copia de seguridad. Todas las modificaciones de datos posteriores a la hora de la copia de seguridad no estarán disponibles en la copia de seguridad. La copia de seguridad programada consta de las siguientes entidades:

  • Esquema de Cassandra que incluye el esquema del usuario (definiciones del espacio de claves de Apigee).
  • Información del token de partición de Cassandra por nodo de Cassandra en un clúster
  • Una instantánea de los datos de Cassandra.

¿Dónde se almacenan los datos de la copia de seguridad?

La ubicación de los datos de la copia de seguridad depende del método de copia de seguridad. Apigee hybrid admite los siguientes métodos para realizar copias de seguridad:

  • Copia de seguridad en Cloud Storage: La copia de seguridad se almacena en los buckets configurados de Cloud Storage en tu proyecto de Google Cloud.
  • Copia de seguridad en un servidor remoto: La copia de seguridad se almacena en un directorio de un servidor remoto que especifiques.

¿Cómo se protegen los datos?

Si usas Cloud Storage para la copia de seguridad, los datos de la copia de seguridad se encriptan de forma predeterminada. En el caso de las copias de seguridad que no están en Cloud Storage, los datos de la copia de seguridad se encriptan durante la transferencia al servidor remoto. Sin embargo, después de la transferencia, debes asegurarte de que los datos de la copia de seguridad estén encriptados en el servidor remoto.

¿Cómo se realizan copias de seguridad?

Debes programar las copias de seguridad como trabajos cron. El cronjob lee la configuración desde un archivo overrides.yaml que configuraste. Apigee recomienda hacer una copia del archivo overrides.yaml para que puedas volver a usarlo durante el proceso de recuperación.

Las siguientes secciones describen en detalle cómo programar copias de seguridad en Cloud Storage y en un servidor remoto.