ジャンプ先

障害復旧計画とは

障害復旧(DR)は、障害(自然か、人間の行動(またはエラー)によるものかを問わず)の発生後に IT インフラストラクチャへのアクセスと機能を復元できるようにする組織の機能です。DR はビジネスの継続性のサブセットであると見なされ、重要なビジネス機能をサポートする IT システムが、壊滅的な事態の発生後、可能な限り早期に運用されるようにすることに焦点を当てます。

今日、障害復旧計画はあらゆる企業にとって、特に部分的にまたは完全にクラウド運用している企業にとって非常に重要です。サービスを中断させ、データ損失を引き起こす障害は、警告なしでいつでも発生する可能性があります。例えば、ネットワークの停止、重大なバグの解放、天候や自然災害などが挙げられます。堅牢で十分にテストされた障害復旧戦略を採用している組織は、異常が発生した場合に中断による影響を最小限に抑え、迅速に復旧し、コア業務を迅速に再開できます。   

Google Cloud のバックアップおよび障害復旧の機能およびプロダクトと、それらを使用してビジネスに適した DR ソリューションを構築する方法について学習します。

IT 障害復旧の定義

IT 障害復旧とは、自然災害または人為的災害の後に重要な IT インフラストラクチャ、ソフトウェア、システムの運用を復旧または継続するために使用されるポリシー、ツール、プロセスのポートフォリオです。

障害復旧計画で何よりも先に考えなければならないのがクラウドです。クラウドは、ビジネスの継続性と障害復旧の両方に対して最適なソリューションと考えられています。クラウドがあれば、個別の障害復旧データセンター(または復旧サイト)を運用する必要がなくなります。

障害復旧サイトとは

第 2 の物理データセンターであり、構築と保守にコストがかかります。クラウドがあれば不要です。

災害とは

DR の計画と戦略は、ビジネスの運営を中断するか完全に停止する障害イベントへの対応と復旧に重点を置いています。

こうしたイベントはハリケーンなどの自然災害だけでなく、深刻なシステム障害、意図的な攻撃、さらには人的エラーによっても発生する可能性があります。 

障害には次のようなものがあります。

  • 自然災害(地震、洪水、竜巻、ハリケーン、山火事など)
  • パンデミックと流行病
  • サイバー攻撃(マルウェア、DDoS、ランサムウェア攻撃など)
  • テロや生化学的攻撃など、人間が意図するその他の脅威
  • 技術的危害(停電、パイプラインの爆発、交通事故など)
  • マシンとハードウェアの障害

障害復旧の重要性

テクノロジーはビジネスのあらゆる側面でますます重要な役割を果たしており、アプリケーションとサービスは、企業のアジリティ、可用性、接続性を向上させます。この傾向は、組織が成長、イノベーション、卓越したカスタマー エクスペリエンスを推進するためにクラウド コンピューティングを広く採用するために行われています。

しかし、クラウド環境(パブリック、プライベート、ハイブリッド、マルチクラウド)への移行と、リモートで働く従業員の増加により、インフラストラクチャの複雑さと潜在的なリスクが増大しています。クラウドベースのシステムの障害復旧は、ビジネス継続性戦略全体にとって非常に重要です。クラウドベースのリソース、アプリケーション、ドキュメント、データ ストレージを多用し、円滑に業務を遂行している企業にとって、システム障害や予期せぬダウンタイムによって深刻な影響が生じることがあります。

また、データ プライバシーに関する法律や基準により、ほとんどの組織は障害復旧戦略を講じる必要が生じています。DR の計画に従わないと、コンプライアンス違反となり、規制当局によって罰金が科される場合があります。

すべての企業は、業種や規模に関係なく、日常業務を中断するイベントから迅速に回復できる必要があります。障害復旧計画がないと、企業はデータ損失、生産性の低下、予算外の費用、評判の悪化による損害や顧客損失につながる可能性があります。

障害復旧の仕組み

障害復旧には、サービスの停止後に重要なアプリケーションやインフラストラクチャを稼働させるための堅実な計画が必要です(理想的には数分以内)。

効果的な DR 計画では、復旧のための 3 つの異なる要素に対処します。

  • 予防的: 最初に災害の発生を防ぐためのツールと手法を使用して、システムのセキュリティと信頼性を確保します。これには、重要なデータのバックアップや、構成エラーやコンプライアンス違反がないかの継続的な環境のモニタリングが含まれます。
  • 検出: 迅速な復元を行うには、レスポンスが必要なタイミングを知る必要があります。この施策では、望ましくないイベントをリアルタイムで検出、検出します。
  • 是正: これらの措置は、潜在的な DR シナリオを計画し、バックアップ オペレーションで影響を軽減し、しかるべき時にデータおよびシステムを迅速に復元するために復旧手順を実施することを目的としています。

通常、障害復旧では、セカンダリ ロケーションまたは複数のロケーション(障害復旧サイト)に重要なデータとワークロードを安全に複製し、バックアップします。障害復旧サイトを使用すると、最新のバックアップまたは過去のある時点のデータを復元できます。 予期しないロケーションが原因でプライマリ ロケーションとそのシステムに障害が発生した場合、プライマリ ロケーションが復旧するまで、DR サイトの使用に切り替えることもできます。

障害復旧の種類

必要な障害復旧の種類は、IT インフラストラクチャ、使用するバックアップと復元の種類、保護する必要があるアセットによって異なります。

障害復旧で使用する最も一般的なテクノロジーと手法の一部を次に示します。

  • バックアップ: バックアップでは、データをオフサイト システムにバックアップするか、外部ドライブをオフサイト ロケーションに配送します。ただし、バックアップには IT インフラストラクチャが含まれていないため、完全な障害復旧ソリューションとは見なされません。
  • BaaS としてバックアップ: BaaS ソリューションは、リモートデータのバックアップと同様に、サードパーティ プロバイダが提供する定期的なデータ バックアップを提供します。
  • サービスとしての障害復旧(DRaaS): 多くのクラウド プロバイダが DRaaS とともに、IaaSPaaS などのクラウド サービス モデルを提供しています。 DRaaS サービスモデルを使用すると、データと IT インフラストラクチャをバックアップし、サードパーティ プロバイダのクラウド インフラストラクチャでホストできます。緊急時には、プロバイダが DR 計画を実装およびオーケストレートして、オペレーションの中断を最小限に抑えてアクセスと機能を復元できるようにします。  
  • ポイントインタイム スナップショット: ポイントインタイム コピーとも呼ばれ、スナップショットが特定の時点におけるデータ、ファイル、さらにはデータベース全体をレプリケートします。 イベントの影響を受けない場所にコピーを保存している限り、スナップショットを使用してデータを復元できます。ただし、スナップショットの作成日時によっては、一部のデータ損失が発生する可能性があります。
  • 仮想 DR: 仮想 DR ソリューションを使用すると、オペレーションとデータをバックアップしたり、さらには、IT インフラストラクチャの完全なレプリカを作成して、オフサイトの仮想マシン(VM)で実行したりできます。障害が発生した場合は、バックアップを再読み込みして、オペレーションをすぐに再開できます。このソリューションでは、データとワークロードの頻繁な転送を効果的にする必要があります。
  • 障害復旧サイト: 組織が障害イベントの発生後に一時的に使用できる場所。データ、システム、その他のテクノロジー インフラストラクチャのバックアップが含まれます。

障害復旧のメリット

ビジネスの継続性の強化

ビジネスがオフラインになると、生産性、カスタマー エクスペリエンス、企業の評判に影響します。障害復旧は、中断を最小限に抑えて復旧できるようにすることで重要なビジネス オペレーションを保護します。

強化されたセキュリティ

DR 計画では、データ バックアップやセキュリティ体制を強化するその他の手順を使用して、攻撃やその他のセキュリティ リスクの影響を最小限に抑えます。たとえば、クラウドベースの障害復旧ソリューションには、高度な暗号化、Identity and Access Management、組織のポリシーなどのセキュリティ機能が組み込まれています。

復旧の高速化

障害復旧ソリューションを使用すると、データとワークロードの復元が容易になるため、壊滅的なイベントの後にビジネス オペレーションをすばやくオンラインに戻すことができます。DR 計画ではデータ レプリケーションを活用し、多くの場合、ダウンタイムとデータ損失を最小限に抑えるために自動復旧を使用します。

復旧費用の削減

ビジネスと生産性の損失やデータ プライバシーのペナルティから賠償金まで、災害イベントの経済的影響は甚大です。障害復旧では、これらの費用の一部を回避したり、最小限に抑えたりできます。Cloud DR プロセスにより、セカンダリ ロケーションの実行と維持にかかる運用コストも削減できます。

高可用性

多くのクラウドベースのサービスには、DR 戦略をサポートする高可用性(HA)機能が搭載されています。HA 機能により、合意されたパフォーマンス レベルを保証し、冗長性と自動フェイルオーバーを組み込みます。これにより、データの可用性に影響する可能性がある機器故障や小規模なイベントからデータを保護できます。

コンプライアンスの向上

DR 計画では、潜在的なリスクを考慮し、障害発生時のデータとワークロードに関する一連の特定の手順と保護を定義することで、コンプライアンス要件をサポートします。これには通常、強力なデータ バックアップ手法、DR サイト、DR プランを定期的にテストし、組織が準備されていることを確認することが含まれます。

障害復旧戦略の計画

包括的な障害復旧戦略には、詳細な緊急対応要件、バックアップ オペレーション、復旧手順を含める必要があります。DR 戦略と計画は、多くの場合、より広範なビジネス継続戦略の策定に役立ちます。これには、IT インフラストラクチャとシステムを超える影響を軽減する緊急時対応計画が含まれ、すべての事業分野ができるだけ早く通常の業務を再開できるようにします。

障害復旧戦略を作成するときは、次の主要指標を十分に考慮する必要があります。

  • 目標復旧時間(RTO): システムとアプリケーションがビジネスに膨大なダメージを与えることなくダウンできる最大許容時間。たとえば、1 時間オフラインになるアプリケーションもあれば、数分で復旧しなければならないアプリケーションもあります。
  • 目標復旧時点(RPO): 大規模なイベントの後に運用を再開するために復旧する必要のあるデータの最長存続期間。RPO はバックアップの頻度を定義するのに役立ちます。

これらの指標は、潜在的な災害(中程度から最悪のケースまで)のリスク評価やビジネス インパクト分析(BIA)に特に役立ちます。リスク評価と BIA は、ビジネスのすべての機能領域とリスクの結果を評価し、イベント発生前または発生後に DR の目標と目標達成に必要なアクションを定義します。

復旧戦略を作成するときは、RTO と RPO の値を考慮し、これらの値と全体的な目標を達成できる DR パターンを選択することをおすすめします。通常、値を小さくするほど(または中断後にアプリケーションを復旧する時間を短縮するほど)、アプリケーションの実行コストが高くなります。

クラウドの障害復旧では、容量、セキュリティ、ネットワーク インフラストラクチャ、帯域幅、サポート、施設に関するオンプレミスの要件を満たす際に、RTO と RPO の費用を大幅に削減できます。Google Cloud の高度なマネージド サービスにより、複雑な要素をほとんど排除して(すべてではない場合)、多くのビジネスの費用を大幅に削減できます。

Google Cloud を使用して障害復旧に対処する方法については、障害復旧計画ガイドをご覧ください。DR 計画の作成については、アカウント マネージャーにお問い合わせください。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
使ってみる
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。
お問い合わせ

障害復旧の目的

障害復旧戦略は、多くの重要な点で事業運営の保護に役立ちます。一般的なユースケースを次に示します。

ビジネス レジリエンスの確保

どのような状況が発生しても、優れた DR 計画により、データやトランザクションを失うことなく、ビジネスを迅速に完全な運用状態に戻すことができます。

競争力の維持

オフラインになった事業からは、ほとんどの顧客が離れてしまいます。顧客は、競合他社から必要な商品やサービスを入手しようとするでしょう。DR 計画によってこうした事態を防げます。

規制リスクの回避

多くの業界には、データの保存場所と保護方法を規定する規制があります。これらの規制に抵触する場合、多額の罰金が科せられます。

データ損失の回避

企業のシステムがダウンしている時間が長いほど、データが失われるリスクが高くなります。堅牢な DR 計画により、このリスクが最小限に抑えられます。

顧客満足度の維持

カスタマー サービス レベル契約(SLA)への対応は、常に優先事項です。適切に実行された DR 計画により、課題に直面している企業でも SLA は達成できます。

評価の維持

機能停止後、スムーズに業務が再開できない企業は、ブランド イメージを損なう可能性があります。そのため、確実な DR 計画が重要です。