災難復原 (DR) 是指機構在災難事件發生後恢復對 IT 基礎架構的存取能力及其功能,無論災難事件是自然發生的還是由人為操作 (或錯誤) 引起的。災難復原被認為是業務永續性計畫的一部分,明確著重於確保支援重要業務功能的 IT 系統在發生中斷事件後能盡快恢復正常運作。
在今日的環境中,災難復原規劃對所有企業都至關重要,尤其是已在雲端營運部分或全部業務的企業更是如此。服務中斷並導致資料遺失的災難隨時都有可能在無預警的情況下發生。您的網路可能會中斷,系統可能出現重大錯誤,或者您公司可能面臨天災威脅。具有完善且經過充分測試的災難復原策略的機構,可以將服務中斷的影響降到最低、加快復原速度,並在災難後迅速恢復核心營運。
進一步瞭解 Google Cloud 備份與災難復原功能和產品,以及如何使用這些功能為貴公司建構合適的災難復原解決方案。
IT 災難復原是一套政策、工具與流程的組合,用於在天災或人為災難後恢復或維持重要 IT 基礎架構、軟體和系統的運作。
災難復原計畫的的首要重點是雲端。雲端是公認能實現業務永續性和災難復原的最佳解決方案。有了雲端環境,就無需另外經營災難復原資料中心 (或復原站點)。
什麼是災難復原站點?
災難復原站點是備用實體資料中心,建置和維護成本都很高,而雲端運算可以完全取而代之。
這些事件可能是颶風等自然災害,也可能是由嚴重的系統故障、蓄意攻擊或人為錯誤導致的災難。
災難的類型可能包括:
在企業營運的各個層面,技術扮演著越來越重要的角色,而應用程式和服務則是讓公司提高敏捷性、可用性和連結力的關鍵。這種趨勢促使機構廣泛採用雲端運算技術來推動增長、創新以及卓越的客戶體驗。
然而,遷移至雲端環境 (公用雲、私有雲、混合雲或多雲端) 的趨勢,以及遠距工作模式的興起,導致基礎架構的複雜度和潛在風險升高。雲端系統的災難復原對業務持續性的整體策略至關重要。如果企業過度依賴雲端資源、應用程式、文件和資料儲存空間來保持業務順暢運作,那麼系統故障或意外停機時可能會造成嚴重後果。
此外,按照資料隱私權法律與標準的規定,大多數機構現在都必須制定災難復原策略。未能落實災難復原計畫可能導致違規行為,並被處以嚴厲罰款。
不論產業別或規模如何,每個企業都需要能夠從日常營運的中斷事件中快速復原。缺少災難復原計畫,公司可能面臨資料遺失、生產力低落、費用超出預算和信譽不良的情況,並導致客戶流失和收入損失。
有效的災難復原計畫須具備以下三種復原措施:
災難復原通常涉及將重要資料和工作負載複製並備份到第二個位置或多個位置 (即災難復原站點)。災難復原站點可用於從最近的備份或過去某個時間點復原資料。如果主要位置及其系統因非預期事件而發生故障,機構也可改為使用災難復原站點,直到主要位置恢復運作為止。
以下是災難復原時最常用的一些技術和技巧:
更強大的業務持續性
當您的業務離線時,每一秒都至關重要,因為這會影響生產力、客戶體驗和公司信譽。災難復原功能可確保關鍵業務能夠在最少中斷或沒有中斷的情況下恢復營運,不造成明顯影響。
安全再升級
災難復原計畫會使用資料備份和其他程序來強化您的安全狀況,並限制攻擊和其他安全風險的影響。舉例來說,雲端災難復原解決方案提供內建安全功能,如進階加密、身分與存取權管理以及組織政策。
復原速度更快
災難復原解決方案可讓您更輕鬆地還原資料和工作負載,在災難事件發生後快速恢復業務營運。災難復原計畫利用資料複製及自動復原功能來將停機時間和資料損失降到最低。
降低復原成本
災難事件的經濟影響可能很大,包括業務和生產力損失、資料隱私權懲罰、贖金等等。透過災難復原,您可以避免或至少將其中的部分費用降至最低。Cloud 災難復原流程還能降低運作及維護第二個地點的營運成本。
高可用性
許多雲端服務都具備可支援災難復原策略的高可用性 (HA) 功能。高可用性功能有助於確保效能達到約定水準,並提供內建的備援和自動容錯移轉程序,保護資料免受設備故障和其他可能影響資料可用性的小規模事件影響。
法規遵循表現更優異
災難復原規劃會考慮潛在風險,並定義一套可在發生災難事件時保障資料和工作負載安全的程序及保護措施,以滿足法規遵循要求。這套辦法通常包含強大的資料備份做法和災難復原站點,以及定期測試災難復原計畫,以確保機構做好準備。
完善的災難復原策略應包含詳細的緊急應變規範、備份作業和復原程序。災難復原策略和計畫通常有助於制定更廣泛的業務持續性策略,其中包括可減輕 IT 基礎架構和系統以外影響,並讓所有業務領域盡快恢復正常運作的應變計畫。
制定災難復原策略時,您應審慎考量下列關鍵指標:
在進行潛在災難風險評估和業務影響分析 (BIA) 時,這些指標在中度風險到最壞情況下尤其有用。風險評估和業務影響分析可以評估企業的所有功能領域,以及任何風險的後果,這有助於定義災難復原目標,以及事件發生之前或之後需要採取的動作。
制定復原策略時,可考量您的復原時間目標值和復原點目標值,並挑選一種有助於達成這些目標值和整體目標的災難復原模式。一般來說,值越低 (或應用程式中斷後需要復原的速度越快),應用程式的運作成本就越高。
在處理容量、安全性、網路基礎架構、頻寬、支援和設施的地端部署需求方面,雲端災難復原功能可大幅降低 RTO 和 RPO 的費用。災難復原是 Google Cloud 提供的一項高度代管服務,可幫您避免絕大多數的複雜因素,並讓您大幅降低業務成本。
如要進一步瞭解如何使用 Google Cloud 解決災難復原問題,請參閱我們的災難復原規劃指南,或是與客戶經理聯絡,取得制定災難復原計畫的協助。
災難復原策略可在許多重要方面協助確保企業營運正常。以下是一些常見的用途。
確保企業具備復原彈性
無論發生什麼情況,出色的災難復原計畫都可以確保企業能夠快速全面恢復營運,而不會損失資料或交易。
維持競爭力
如果企業營運中斷,就很難留住客戶。客戶會轉向競爭對手來取得所需的商品或服務。有了災難復原計畫,就可以防止這樣的情況發生。
避免違規風險
對於資料儲存位置和資料保護措施,很多產業都有相關的法規要求。如未能遵循這些法規要求,企業將面臨高額罰款。
預防資料損失
企業系統停機的時間越長,資料遺失的風險就越高。完善可靠的災難復原計畫能將這類風險降至最低。
讓客戶滿意
履行客戶服務水準協議 (SLA) 始終是第一優先的目標。執行成效良好的災難復原計畫才能協助企業克服各種挑戰,順利達成 SLA。
維繫商譽
企業在服務中斷後,如果無法恢復營運,品牌形象可能會受到傷害。因此,可靠的災難復原計畫至關重要。