Ir a

¿Qué es un plan de recuperación tras fallos?

La recuperación tras fallos es la capacidad de una organización para restaurar el acceso y la funcionalidad de su infraestructura de TI, después de que se produzca un desastre, ya sea de forma natural o causada por una acción humana (o un error). La DR se considera un subconjunto de continuidad empresarial, y se centra explícitamente en que los sistemas de TI que admiten funciones empresariales esenciales funcionen lo antes posible después de que se produzca un evento molesto.

Hoy en día, es imprescindible planificar una recuperación tras fallos, especialmente si lo hace parte o la totalidad de la nube. Se pueden producir fallos si interrumpen el servicio y provocan la pérdida de datos en cualquier momento sin previo aviso; por ejemplo, la red puede tener una interrupción, un fallo crítico que podría salirse o la empresa podría tener que soportar un desastre natural. Las organizaciones que cuentan con estrategias sólidas y de eficacia probada de recuperación tras fallos pueden minimizar el impacto de las interrupciones, agilizar los tiempos de recuperación y reanudar las operaciones principales rápidamente cuando todo va mal.   

Obtén más información sobre las funciones y los productos de recuperación tras fallos y copias de seguridad de Google Cloud y cómo pueden usarse para crear la solución de DR adecuada para tu negocio.

Definición de la recuperación tras fallos de TI

La recuperación tras fallos de TI incluye un conjunto de políticas, herramientas y procesos que se usan para recuperar o volver a poner en marcha operaciones de componentes de TI, software o sistemas fundamentales tras un fallo humano o producido por factores naturales.

El aspecto más importante de los planes de recuperación tras fallos es la nube. Se trata de la mejor solución para dar continuidad a la actividad empresarial y llevar a cabo una recuperación tras fallos. Con la nube, desaparece la necesidad de contar con un centro de datos (o instalaciones físicas de otro tipo) de recuperación tras fallos independiente.

¿Qué es un sitio de recuperación tras fallos?

Se trata de un segundo centro de datos físico con unos costes de construcción y mantenimiento elevados. Gracias a la nube, este tipo de centros no son necesarios.

¿Qué se considera un desastre?

La planificación DR y las estrategias de recuperación tras fallos se centran en responder a los desastres y recuperarse de esos fallos, es decir, eventos que interrumpen o dejan de funcionar una empresa por completo.

Aunque estos eventos pueden ser desastres naturales, como un huracán, también pueden ser causa de un grave fallo del sistema, un ataque intencionado o incluso un error humano. 

Entre los tipos de desastres se incluyen los siguientes:

  • Desastres naturales (por ejemplo, terremotos, inundaciones, tornados, huracanes o incendios forestales)
  • Pandemias y epidemias
  • Ataques cibernéticos (por ejemplo, ataques de DDoS, de software malicioso o de ransomware)
  • Otras amenazas deliberadas causadas por el ser humano, como los ataques bioquímicos o terroristas
  • Peligros tecnológicos (por ejemplo, interrupciones del suministro eléctrico, explosiones de conductos y accidentes de transporte)
  • Fallo del equipo y del hardware

La importancia de la recuperación tras fallos

La tecnología desempeña un papel cada vez más importante en todos los aspectos empresariales, ya que ofrece aplicaciones y servicios que permiten a las empresas ser más ágiles, disponibles y conectadas. Esta tendencia ha contribuido a la adopción generalizada del cloud computing por parte de las organizaciones para impulsar el crecimiento, la innovación y la experiencia del cliente excepcional.

Sin embargo, el hecho de migrar a entornos en la nube (públicos, privados, híbridos o multinube) y el auge de los trabajadores remotos están entrando en un aumento de la complejidad de la infraestructura y de los posibles riesgos. La recuperación tras fallos de los sistemas basados en la nube es fundamental para asegurar una estrategia de continuidad de la actividad empresarial. Un desglose del sistema o un periodo de inactividad no planificado puede tener graves consecuencias para las empresas que dependen en gran medida de los recursos, las aplicaciones, los documentos y el almacenamiento de datos basados en la nube para que todo funcione sin contratiempos.

Además, las leyes y estándares de privacidad de datos estipulan que ahora la mayoría de las organizaciones deben contar con una estrategia de recuperación tras fallos. El incumplimiento de los planes de recuperación tras fallos puede conllevar infracciones de cumplimiento y multas regulatorias.

Todas las empresas deben poder recuperarse rápidamente de cualquier evento que detenga las operaciones diarias, independientemente del sector o del tamaño. Sin un plan de recuperación tras fallos, una empresa puede perder datos, reducir su productividad, agotar los presupuestos, y dañar la reputación puede ocasionar la pérdida de clientes e ingresos.

Cómo funciona la recuperación tras fallos

La recuperación tras fallos requiere contar con un plan de trabajo sólido para ejecutar las aplicaciones y la infraestructura fundamentales tras una interrupción del servicio, preferiblemente en cuestión de minutos.

Un plan de recuperación tras fallos eficaz aborda tres elementos diferentes para la recuperación:

  • Prevención: asegúrate de que tus sistemas sean lo más seguros y fiables posible con herramientas y técnicas para evitar que ocurra un desastre en primer lugar. Esto puede incluir la copia de seguridad de datos críticos o la monitorización continua de entornos para detectar errores de configuración e infracciones de cumplimiento.
  • Detective: para una recuperación rápida, tendrás que saber cuándo se necesita una respuesta. Estas medidas se centran en detectar o descubrir eventos no deseados en tiempo real.
  • Corrección: Estas medidas tienen como objetivo planificar posibles situaciones de recuperación tras fallos, asegurar operaciones de copia de seguridad para reducir el impacto y poner en práctica procedimientos de recuperación para restaurar datos y sistemas rápidamente cuando llegue el momento.

Por lo general, la recuperación tras fallos implica replicar y crear copias de seguridad de los datos y las cargas de trabajo fundamentales de forma segura en una ubicación secundaria o en varias ubicaciones (sitios de recuperación tras fallos). Puedes utilizar un sitio de recuperación tras fallos para recuperar datos de la copia de seguridad más reciente o de un momento anterior. Las organizaciones también pueden empezar a usar un sitio de DR si la ubicación principal y sus sistemas fallan debido a un evento imprevisto hasta que se restaure la principal.

Tipos de recuperación tras fallos

Los tipos de recuperación tras fallos que dependen de tu infraestructura de TI, el tipo de copia de seguridad y recuperación que uses, y los recursos que necesites proteger.

Estas son algunas de las tecnologías y técnicas más utilizadas en la recuperación tras fallos:

  • Copias de seguridad: crea copias de seguridad de tus datos en un sistema externo o envía una unidad externa a una ubicación externa. No obstante, las copias de seguridad no incluyen ninguna infraestructura de TI, por lo que no se consideran una solución completa de recuperación tras fallos.
  • Copia de seguridad como servicio (BaaS): al igual que las copias de seguridad de datos remotos, las soluciones de BaaS proporcionan copias de seguridad de datos periódicas que ofrece un proveedor externo.
  • Recuperación tras fallos como servicio (DRaaS): Muchos proveedores de servicios en la nube ofrecen recuperación tras fallos como servicio (DRaaS) y modelos de servicio en la nube comoIaaS yPaaS. Un modelo de servicio de DRaaS te permite crear copias de seguridad de tus datos y tu infraestructura de TI, así como alojarlos en la infraestructura en la nube de un proveedor externo. Durante una crisis, el proveedor implementará y orquestará tu plan de DR para ayudar a recuperar el acceso y la funcionalidad con una interrupción del funcionamiento mínima.  
  • Instantáneas en el momento: también se denominan "copias a un momento dado". Las capturas replican datos, archivos o incluso una base de datos completa en un momento específico. Las capturas pueden usarse para restaurar datos, siempre que la copia se almacene en una ubicación que no se vea afectada por el evento. Sin embargo, puede producirse una pérdida de datos en función de cuándo se hizo la captura.
  • Recuperación virtual: con las soluciones de DR virtual, puedes crear copias de seguridad de tus operaciones y datos, o incluso crear una réplica completa de tu infraestructura de TI para ejecutarlas en máquinas virtuales de terceros. En caso de desastre, puedes volver a cargar la copia de seguridad y reanudar la operación rápidamente. Para que esta solución sea efectiva, es necesario transferir datos y transferir cargas de trabajo con frecuencia.
  • Sitios de recuperación tras fallos: son ubicaciones que las organizaciones pueden utilizar temporalmente después de un desastre, que contienen copias de seguridad de datos, sistemas y otra infraestructura tecnológica.

Ventajas de la recuperación tras fallos

Continuidad de la actividad empresarial

Cada segundo cuenta cuando tu empresa deja de estar disponible, lo que afecta a su productividad, su experiencia con el cliente y la reputación de tu empresa. La recuperación tras fallos ayuda a proteger las operaciones comerciales críticas, ya que garantiza que puedan recuperarse con una interrupción mínima o inexistente.

Seguridad mejorada

Los planes de DR utilizan copias de seguridad de datos y otros procedimientos que refuerzan tu estrategia de seguridad y limitan el impacto de los ataques y otros riesgos de seguridad. Por ejemplo, las soluciones de recuperación tras fallos basadas en la nube tienen funciones de seguridad integradas, como encriptado avanzado, gestión de identidades y accesos, y políticas de organización.

Recuperación más rápida

Con las soluciones de recuperación tras fallos, restaurar tus datos y cargas de trabajo es más fácil. Así, puedes reanudar las operaciones empresariales rápidamente en caso de que se produzca un evento catastrófico. Los planes de recuperación tras fallos aprovechan la replicación de datos y suelen utilizar la recuperación automática para minimizar el periodo de inactividad y la pérdida de datos.

Reducción de los costes de recuperación

Las repercusiones monetarias de un evento de desastres pueden ser significativas, desde la pérdida de negocio y productividad, hasta las penalizaciones por privacidad de datos o los rescates. Gracias a la recuperación tras fallos, puedes evitar, o al menos minimizar, algunos de estos costes. Los procesos de Cloud DR también pueden reducir los costes operativos que conlleva ejecutar y mantener una ubicación secundaria.

Alta disponibilidad

Muchos servicios basados en la nube incluyen funciones de alta disponibilidad que pueden ayudarte con tu estrategia de DR. Las funciones de alta disponibilidad te ayudan a alcanzar un nivel de rendimiento acordado y cuentan con redundancia integrada y conmutación por error automática, lo que protege los datos frente a fallos del equipo y otros eventos a pequeña escala que pueden afectar a la disponibilidad de los datos.

Mejor cumplimiento

La planificación de la recuperación tras fallos cumple los requisitos de cumplimiento. Para ello, tiene en cuenta posibles riesgos y define un conjunto de procedimientos y protecciones específicos para tus datos y cargas de trabajo en caso de desastre. Por lo general, esto incluye prácticas recomendadas de copia de seguridad, sitios de DR y pruebas periódicas de tu plan de DR para asegurarte de que tu organización está preparada.

Planificación de una estrategia de recuperación tras fallos

Una estrategia integral de recuperación tras fallos debe incluir requisitos detallados de respuesta a emergencias, operaciones de copia de seguridad y procedimientos de recuperación. Las estrategias y los planes de DR a menudo contribuyen a crear una estrategia de continuidad de la actividad más amplia que incluye planes de contingencia para mitigar el impacto más allá de la infraestructura y los sistemas de TI, lo que permite que todas las áreas de negocio reanuden las operaciones normales lo antes posible.

A la hora de crear estrategias de recuperación tras fallos, debes tener en cuenta las siguientes métricas clave:

  • Objetivo de tiempo de recuperación (RTO): tiempo máximo aceptable que los sistemas y aplicaciones pueden estar inactivos sin causar daños importantes a la empresa. Por ejemplo, algunas aplicaciones pueden estar sin conexión durante una hora, mientras que otras pueden necesitar recuperarse pasados unos minutos.
  • Objetivo de punto de recuperación (RPO): edad máxima de los datos que debes recuperar para reanudar las operaciones después de un evento importante. El RPO ayuda a definir la frecuencia de las copias de seguridad.

Estas métricas son especialmente útiles para llevar a cabo evaluaciones de riesgos y análisis de impacto empresarial (BIA) en caso de posibles desastres, desde situaciones de dificultad moderada a peor. Las evaluaciones de riesgos y los BIA evalúan todas las áreas funcionales de una empresa y las consecuencias de cualquier riesgo, lo que puede ayudar a definir los objetivos de DR y las acciones necesarias para lograrlos antes o después de que se produzca un evento.

Cuando crees tu estrategia de recuperación, es útil tener en cuenta los valores de RTO y RPO, así como elegir un patrón de DR que te permita cumplir dichos valores y tus objetivos generales. Por lo general, cuanto más pequeños sean los valores (o cuanto más rápido necesiten recuperar tus aplicaciones después de una interrupción), mayor será el coste de ejecutar tu aplicación.

La recuperación tras fallos de la nube puede reducir en gran medida los costes de los RTOs y los RPOs en lo que respecta a cumplir los requisitos on‐premise de capacidad, seguridad, infraestructura de red, ancho de banda, asistencia e instalaciones. Un servicio muy gestionado de Google Cloud puede ayudarte a evitar la mayoría o todos los factores, lo que complica aún más los costes y te permite reducir muchos costes empresariales.

Si necesitas más ayuda para usar Google Cloud con el proceso de recuperación tras fallos, puedes consultar nuestra guía de planificación para la recuperación tras fallos o ponerte en contacto con tu gestor de cuentas para que te ayude a crear un DR.

Soluciona los retos más complejos que se te presenten con Google Cloud

Los nuevos clientes reciben 300 USD en crédito gratis para invertirlos en Google Cloud.
Primeros pasos
Habla con un especialista del equipo de ventas de Google Cloud para hablar sobre tu reto único con más detalle.
Contactar

¿Para qué se usa la recuperación tras fallos?

Las estrategias de recuperación tras fallos ayudan a proteger las operaciones empresariales de distintas formas esenciales. A continuación se indican algunos de los usos más habituales.

Asegura la resiliencia de tu negocio

No importa lo que ocurra: con un buen plan de recuperación tras fallos, tu negocio podrá volver a estar en pleno funcionamiento rápidamente y sin perder datos ni transacciones.

Que no te adelante la competencia

Cuando un negocio se queda sin conexión, lo más habitual es que sus clientes busquen otra opción. Recurrirán a la competencia para conseguir los productos o servicios que necesitan. Para evitar que suceda, una buena opción es tener un plan de recuperación tras fallos.

Cumple siempre las normativas

En muchos sectores hay normas que establecen dónde pueden almacenarse los datos y cómo deben protegerse. El incumplimiento de esas normas conlleva multas muy severas.

Evita la pérdida de datos

Cuanto más tiempo permanezcan sin conexión los sistemas de una empresa, mayor será el riesgo de que se pierdan sus datos. Con un plan sólido de recuperación tras fallos, ese riesgo se minimiza.

Aboga por la felicidad de los clientes

Cumplir con los acuerdos de nivel de servicio ofrecidos a los clientes siempre es una prioridad. Un plan de recuperación tras fallos bien ejecutado puede ayudar a cumplir esos acuerdos a pesar de posibles problemas.

Mantén tu reputación

Un negocio que tiene problemas para continuar con sus operaciones tras un fallo puede ver perjudicada su marca. Por ello, es fundamental contar con un buen plan de recuperación tras fallos.