使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。
跳转到

什么是灾难恢复计划?

灾难恢复 (DR) 是组织在灾难事件发生后恢复对 IT 基础架构的访问和功能的能力,无论灾难事件是自然发生的还是由人为操作(或错误)引起的。灾难恢复被认为是业务连续性的一个部分,明确侧重于确保支持关键业务功能的 IT 系统在中断事件发生后尽快运行。

目前,灾难恢复规划对所有企业都至关重要,尤其是部分或完全在云端运营的企业。中断服务并导致数据丢失的灾难可能会在没有警告的情况下随时发生 - 您的网络可能会中断,可能会出现一个严重的错误,或者您的企业可能不得不经受自然灾害。拥有强大且经过充分测试的灾难恢复策略的组织可以最大限度地减少中断的影响,实现更快的恢复速度,并在灾难消失后迅速恢复核心运营。   

详细了解 Google Cloud 备份和灾难恢复功能和产品,以及如何使用这些功能和产品为您的企业构建合适的灾难恢复解决方案。

IT 灾难恢复的定义

IT 灾难恢复是一套政策、工具与流程的组合,用于在天灾或人祸发生后恢复或继续关键 IT 基础架构、软件和系统的运作。

灾难恢复计划的首要重点是云端。云端被认为是实现业务连续性和灾难恢复的最佳解决方案。使用云端,就无需运行单独的灾难恢复数据中心(或恢复站点)。

什么是灾难恢复站点?

这是第二个物理数据中心,构建和维护的成本都很高,但在使用云解决方案时无需恢复站点。

什么会被视为灾难?

灾难恢复计划和策略侧重于应对灾难(即中断或完全停止业务运营的事件)以及从灾难中恢复。

虽然这些事件可能是飓风等自然灾害,但也可能由严重系统故障、故意攻击,甚至是人为错误导致。 

灾难的类型可能包括:

  • 自然灾害(如地震、洪水、龙卷风、飓风或野火)
  • 疫情与流行病
  • 网络攻击(例如恶意软件、DDoS 攻击和勒索软件攻击)
  • 其他由人为造成的蓄意威胁,例如恐怖袭击或生化攻击
  • 技术危害(例如断电、管道爆炸和交通事故)
  • 机器和硬件故障

灾难恢复的重要性

技术在业务的各个方面扮演着越来越重要的角色,而应用和服务可让企业提高灵活性、可用性和连贯性。这种趋势推动了组织广泛采用云计算,以推动增长、创新和卓越的客户体验。

然而,迁移到公有云、私有云、混合云或多云环境以及远程员工数量的增长正在增加基础架构复杂性和潜在风险。云端系统的灾难恢复对整体业务连续性策略至关重要。如果企业严重依赖云端资源、应用、文档和数据存储来保持顺畅运行,那么系统故障或计划外停机时间可能会造成严重后果。

此外,数据隐私权法律和标准规定,大多数组织现在都需要制定灾难恢复策略。违反 DR 计划可能会导致违规行为,并受到严厉的罚款。

无论行业或规模如何,每个企业都需要能够从任何停止日常运营的事件中快速恢复正常。如果不使用灾难恢复计划,公司将遭受数据损失、生产力降低、预算外支出以及声誉损失,进而导致客户损失和收入损失。

灾难恢复的工作原理

灾难恢复依赖于可靠的计划,以便在服务中断后(最好在几分钟内)启动并运行关键应用和基础架构。

有效的灾难恢复计划可以解决三个不同的恢复元素:

  • 预防措施:尽可能使用工具和技术防止系统发生灾难,以确保系统尽可能安全可靠。其中可能包括备份关键数据,或持续监控环境以发现配置错误和违规行为。
  • 检测措施:为了快速恢复,您需要知道何时需要响应。这些措施侧重于实时检测或发现不需要的事件。
  • 纠正措施:这些措施旨在为潜在的灾难恢复场景进行规划,确保备份操作减少影响,以及在灾难发生时执行恢复过程以快速恢复数据和系统。

通常,灾难恢复涉及将关键数据和工作负载安全地复制并备份到辅助位置或多个位置,即灾难恢复网站。灾难恢复网站可用于从最近的备份或以前的时间点恢复数据。 如果主要位置及其系统因不可预见的事件而发生故障,则组织也可以改为使用灾难恢复站点,直到主要位置恢复为止。

灾难恢复的类型

您需要的灾难恢复类型取决于您的 IT 基础架构、使用的备份和恢复类型以及需要保护的资产。

以下是灾难恢复中最常用的一些技术:

  • 备份:通过备份,您可以将数据备份到异地系统或将外部硬盘寄送到异地位置。但是,备份不包含任何 IT 基础架构,因此不被视为一个完整的灾难恢复解决方案。
  • 备份即服务 (BaaS) :与远程数据备份类似,BaaS 解决方案提供由第三方提供商提供的常规数据备份。
  • 灾难恢复即服务 (DRaaS):许多云服务提供商都提供 DRaaS 以及诸如 IaaSPaaS 等云服务模型。借助 DRaaS 服务模型,您可以备份数据和 IT 基础架构,并将其托管在第三方提供商的云基础架构上。在灾难发生时,提供商会实施和编排灾难恢复方案,以便在尽可能不中断操作的情况下帮助恢复访问和功能。  
  • 时间点快照:也称为时间点副本,快照会在特定时间点复制数据、文件甚至整个数据库。只要副本存储在不受事件影响的位置,快照就可用于恢复数据。不过,数据可能会丢失,具体取决于创建快照的时间。
  • 虚拟灾难恢复:通过虚拟灾难恢复解决方案,您可以备份操作和数据,甚至创建 IT 基础架构的完整副本,并在异地虚拟机 (VM) 上运行。如果发生灾难,您可以快速重新加载备份和恢复操作。此解决方案需要执行频繁的数据和工作负载转移作业才有效。
  • 灾难恢复网站:这些是组织在发生灾难事件后可以临时使用的位置,其中包含数据、系统和其他技术基础架构的备份。

灾难恢复的优势

业务连续性更强

当您的业务离线时,每一秒都至关重要,这会影响生产力、客户体验和公司的声誉。灾难恢复可以确保关键业务运营能够在最少中断或没有中断的情况下恢复,从而帮助保护关键业务运营。

增强型安全功能

灾难恢复计划会使用数据备份和其他过程来增强安全状况并限制攻击和其他安全风险的影响。例如,云端灾难恢复解决方案提供内置安全功能,如高级加密、身份和访问权限管理以及组织政策。

恢复速度更快

借助灾难恢复解决方案,您可以更轻松地恢复数据和工作负载,从而在灾难性事件发生后快速恢复业务运营。灾难恢复计划利用数据复制,并且通常依靠自动恢复来最大限度地减少停机时间和数据丢失。

降低了恢复费用

灾难事件的经济影响可能很大,包括业务和生产力损失、数据隐私权处罚、赎金等等。借助灾难恢复,您可以避免或至少将其中的部分费用降至最低。Cloud 灾难恢复流程还可以降低运行和维护辅助位置的运营费用。

高可用性

许多云端服务都附带有可支持灾难恢复策略的高可用性 (HA) 功能。高可用性功能有助于确保达到约定的性能水平,并提供内置冗余和自动故障切换,从而保护数据免受设备故障和其他可能会影响数据可用性的较小事件的影响。

合规性更高

灾难恢复计划考虑了潜在风险,并定义了一套适用于灾难发生时的数据和工作负载的特定流程和保护措施,以满足合规性要求。这通常包括强大的数据备份做法和灾难恢复网站,以及定期测试灾难恢复计划以确保组织做好准备。

规划灾难恢复策略

全面的灾难恢复策略应包含详细的紧急响应要求、备份操作和恢复过程。灾难恢复策略和计划通常有助于制定更广泛的业务连续性战略,其中包括应急计划以减轻 IT 基础架构和系统之外的影响,从而允许所有业务领域尽快恢复正常运行。

在制定灾难恢复策略时,您应该仔细考虑以下关键指标:

  • 恢复时间目标 (RTO):在不对业务造成重大损害的情况下,系统和应用可以关停的最长可接受时间。例如,有些应用可以离线一小时,而有些应用可能需要在几分钟内恢复。
  • 恢复点目标 (RPO):在发生重大事件后恢复操作所需的最长数据期限。RPO 有助于定义备份频率。

在进行潜在灾难风险评估和业务影响分析 (BIA) 时,这些指标在中低风险场景和最坏情况下尤其有用。风险评估和 BIA 可以评估业务的所有职能领域以及任何风险的后果,这有助于定义灾难恢复目标以及事件发生之前或之后需要执行的操作。

创建恢复策略时,考虑 RTO 和 RPO 值并选择一个灾难恢复模式,以便能够实现这些值和总体目标很有用。通常,值越小(或应用中断后需要恢复的速度越快),运行应用的费用就越高。

在满足容量、安全性、网络基础架构、带宽、支持和设施方面的本地要求时,Cloud 灾难恢复可显著降低 RTO 和 RPO 的成本。Google Cloud 上一项全代管式服务可帮助您避免大多数(如果不是全部的话)复杂因素,并让您大幅降低许多业务成本。

如需有关使用 Google Cloud 处理灾难恢复的更多指导,请阅读我们的灾难恢复规划指南,或与您的客户经理联系以获取有关创建灾难恢复计划的帮助。

利用 Google Cloud 解决业务难题

新客户可获得 $300 赠金,用于抵扣在 Google Cloud 上的支出。
开始使用
与 Google Cloud 销售专员联系,详细讨论您的独特挑战。
与我们联系

灾难恢复有什么用途?

灾难恢复策略可以从多个重要方面帮助保护企业的运营。以下是一些常见使用场景。

确保业务弹性

无论发生什么情况,出色的灾难恢复计划都可以确保企业能够快速恢复全面运营,而不会损失数据或交易。

维持竞争力

一旦企业的服务中断,客户很少会保持忠诚。他们会转向竞争对手获取所需的商品或服务。灾难恢复计划可以避免这种情况的发生。

避免监管风险

在数据存储位置以及数据保护力度方面,许多行业都有相应的法规要求。如果不满足这些要求,将招致巨额罚款。

避免数据丢失

企业的系统停机时间越长,丢失数据的风险就越大。强大的灾难恢复计划可最大程度地降低这种风险。

让客户满意

无论什么时候,履行客户服务等级协议 (SLA) 都是重中之重。执行得当的灾难恢复计划可以帮助企业克服挑战,顺利履行 SLA。

维护声誉

企业如果在服务中断后无法顺利恢复运营,其品牌形象可能会遭受损害。有鉴于此,制定可靠的灾难恢复计划至关重要。