障害復旧計画とは

障害復旧(DR)は、障害(自然か、人間の行動(またはエラー)によるものかを問わず)の発生後に IT インフラストラクチャへのアクセスと機能を復元できるようにする組織の機能です。DR はビジネスの継続性のサブセットであると見なされ、重要なビジネス機能をサポートする IT システムが、壊滅的な事態の発生後、可能な限り早期に運用されるようにすることに焦点を当てます。

今日、障害復旧計画はあらゆる企業にとって、特に部分的にまたは完全にクラウド運用している企業にとって非常に重要です。サービスを中断させ、データ損失を引き起こす障害は、警告なしにいつでも発生する可能性があります。例えば、ネットワークが停止する、致命的なバグがリリースされる、自然災害を乗り切る必要がある、などです。堅牢で十分にテストされた障害復旧戦略を採用している組織は、異常が発生した場合に中断による影響を最小限に抑え、迅速に復旧し、コア業務を速やかに再開できます。   

Google Cloud のバックアップと障害復旧の機能およびプロダクトと、それらを使用してビジネスに適した DR ソリューションを構築する方法について学習します。

IT 障害復旧の定義

IT 障害復旧とは、自然災害または人為的災害の後に重要な IT インフラストラクチャ、ソフトウェア、システムの運用を復旧または継続するために使用されるポリシー、ツール、プロセスのポートフォリオです。

障害復旧計画で何よりも先に考えなければならないのがクラウドです。クラウドは、ビジネスの継続性と障害復旧の両方に対して最適なソリューションと考えられています。クラウドがあれば、個別の障害復旧データセンター(または復旧サイト)を運用する必要がなくなります。

障害復旧サイトとは

第 2 の物理データセンターであり、構築と保守にコストがかかります。クラウドがあれば不要です。

災害とは

DR の計画と戦略は、ビジネスの運営を中断するか完全に停止する障害イベントへの対応と復旧に重点を置いています。

このような事象はハリケーンのような自然災害の場合もありますが、深刻なシステム障害、意図的な攻撃、さらには人為的なミスによって引き起こされることもあります。

障害の種類には次のようなものがあります。

  • 自然災害(地震、洪水、竜巻、ハリケーン、山火事など)
  • パンデミックと流行病
  • サイバー攻撃(マルウェア攻撃、DDoS 攻撃、ランサムウェア攻撃など)
  • テロ攻撃や生物化学兵器による攻撃など、意図的に人為的に引き起こされるその他の脅威
  • 技術的危害(停電、パイプラインの爆発、輸送機関の事故など)
  • マシンやハードウェアの障害

障害復旧の重要性

テクノロジーはビジネスのあらゆる側面においてますます重要な役割を果たしており、アプリケーションやサービスによって企業はより俊敏に、より利用しやすく、より接続しやすくなっています。この傾向は、企業がクラウド コンピューティングを広く採用し、成長、イノベーション、卓越したカスタマー エクスペリエンスを推進するのに寄与しています。

しかし、クラウド環境(パブリック、プライベート、ハイブリッド、マルチクラウド)への移行とリモートで働く従業員の増加により、インフラストラクチャの複雑さが増し、潜在的なリスクが生じています。クラウドベースのシステムの障害復旧は、全体的な事業継続戦略にとって極めて重要です。システムの故障や計画外のダウンタイムが発生すると、物事を円滑に進めるためにクラウドベースのリソース、アプリケーション、ドキュメント、データ ストレージに大きく依存している企業にとって深刻な結果をもたらす可能性があります。

さらに、データ・プライバシーに関する法律や標準により、現在ではほとんどの組織に障害復旧戦略を持つことが義務付けられています。DR 計画に従わないと、コンプライアンス違反や高額な罰金につながる可能性があります。

業種や規模に関係なく、あらゆる企業は、日常の業務を停止させるようなあらゆる事象から迅速に復旧する必要があります。障害復旧計画がなければ、企業はデータの損失、生産性の低下、予算外の出費、イメージの悪化などに見舞われ、客離れや収益の損失につながる可能性があります。

障害復旧の仕組み

障害復旧には、サービスの停止後(理想的には数分以内)に重要なアプリケーションやインフラストラクチャを稼働させるための堅実な計画が必要です。

効果的な DR 計画では、復旧のために次の 3 つの要素に対処します。

  • 予防: 障害の発生を未然に防ぐためのツールや手法を使用して、システムの安全性と信頼性を可能な限り確保します。これには、重要なデータのバックアップや、環境の構成エラーやコンプライアンス違反の継続的なモニタリングなどが含まれます。
  • 探知: 迅速な復旧のために、対応が必要なタイミングを知る必要があります。こうした対策は、望ましくないイベントの発生をリアルタイムで検出または発見することに重点を置いています。
  • 是正: これらの措置は、潜在的な DR シナリオの計画を行い、影響を軽減するためのバックアップ オペレーションを確保し、いざというときにデータやシステムを迅速に復元するために復旧手順を実施することを目的としています。

通常、障害復旧では、セカンダリ ロケーションまたは複数のロケーション(障害復旧サイト)に重要なデータとワークロードを安全に複製し、バックアップします。障害復旧サイトを使用すると、最新のバックアップまたは過去のある時点からデータを復元できます。予期しないイベントが原因でプライマリ ロケーションとそのシステムに障害が発生した場合、プライマリ ロケーションが復旧するまで、DR サイトの使用に切り替えることもできます。

障害復旧の種類

必要な障害復旧の種類は、IT インフラストラクチャ、使用するバックアップと復元の種類、保護する必要があるアセットによって異なります。

ここでは、障害復旧において最も一般的なテクノロジーと手法をいくつか紹介します。

  • バックアップ: バックアップでは、データをオフサイトのシステムにバックアップするか、外付けドライブをオフサイトの場所に発送します。ただし、バックアップには IT インフラストラクチャが含まれていないため、完全な障害復旧ソリューションとは見なされません。
  • Backup as a Service(BaaS): リモートデータ バックアップと同様に、BaaS ソリューションにはサードパーティ プロバイダが提供する定期的なデータ バックアップが用意されています。
  • Disaster Recovery as a Service(DRaaS): 多くのクラウド プロバイダが DRaaS を、IaaSPaaS などのクラウド サービス モデルとともに提供しています。DRaaS サービスモデルを使用すると、データと IT インフラストラクチャをバックアップし、サードパーティ プロバイダのクラウド インフラストラクチャでホストできます。危機発生時には、プロバイダが DR 計画を実行してオーケストレーションし、運用の中断を最小限に抑えてアクセスと機能の回復を支援します。  
  • ポイントインタイム スナップショット: ポイントインタイム コピーとも呼ばれます。スナップショットは、特定の時点のデータ、ファイル、またはデータベース全体を複製します。スナップショットは、イベントの影響を受けない場所にコピーが保存されている限り、データを復元するために使用できます。ただし、スナップショットが作成されたタイミングによっては、データ損失が発生する可能性があります。
  • 仮想 DR: 仮想 DR ソリューションを使用すると、オペレーションとデータをバックアップできます。また、IT インフラストラクチャの完全なレプリカを作成して、オフサイトの仮想マシン(VM)で実行することもできます。障害が発生した場合は、バックアップを再読み込みしてオペレーションをすぐに再開できます。このソリューションが効果を発揮するには、頻繁なデータとワークロードの転送が必要です。
  • 障害復旧サイト: 障害発生後に組織が一時的に使用できる場所で、データ、システム、その他の技術インフラストラクチャのバックアップが保管されます。

障害復旧のメリット

ビジネスの継続性の強化

ビジネスがオフラインになると、その一瞬一瞬が生産性、カスタマー エクスペリエンス、会社の評判に影響を及ぼします。障害復旧とは、業務の中断を最小限に抑え、あるいは中断することなく復旧できるようにすることで、重要な業務の安全保護対策として役立ちます。

強化されたセキュリティ

DR 計画では、データ バックアップなどの手順を使用してセキュリティ対策を強化し、攻撃やその他のセキュリティ リスクの影響を制限します。たとえば、クラウドベースの障害復旧ソリューションには、高度な暗号化、Identity and Access Management、組織のポリシーなどのセキュリティ機能が組み込まれています。

回復の迅速化

障害復旧ソリューションを使用すると、データとワークロードの復元が容易になるため、壊滅的なイベントが発生しても、ビジネス オペレーションを迅速にオンラインに戻すことができます。DR 計画ではデータ レプリケーションを活用し、多くの場合、ダウンタイムとデータ損失を最小限に抑える自動リカバリを利用しています。

復旧費用の削減

災害が発生した場合の金銭的な影響は、ビジネスや生産性の喪失から、データ プライバシーへのペナルティ、身代金の支払いに至るまで、多岐にわたって甚大になる可能性があります。障害復旧により、このような費用の一部を回避するか、あるいは少なくとも最小限に抑えることができます。Cloud DR プロセスにより、セカンダリ ロケーションの運用と維持にかかる運用コストも削減できます。

高可用性

クラウドベースのサービスの多くは、DR 戦略をサポートする高可用性(HA)機能を備えています。HA 機能は、合意レベルのパフォーマンスを確保し、組み込みの冗長性と自動フェイルオーバーを提供し、機器の故障やデータの可用性に影響する可能性があるその他の小規模なイベントからデータを保護します。

コンプライアンスの強化

DR 計画では、潜在的なリスクを考慮し、障害発生時にデータとワークロードに対して一連の具体的な手順と保護を定義することで、コンプライアンス要件に対応できます。これには通常、強力なデータ バックアップの実施、DR サイト、組織の準備ができていることを確認する DR 計画の定期的なテストが含まれます。

障害復旧戦略の計画

包括的な障害復旧戦略には、緊急対応の詳細な要件、バックアップ オペレーション、復旧手順を含める必要があります。DR 戦略と計画は、多くの場合、広範な事業継続戦略の策定に役立ちます。これには、IT インフラストラクチャとシステム以外の影響を軽減する緊急時対応計画も含まれます。これにより、すべての事業分野が可能な限り早く通常業務を再開できるようになります。

障害復旧戦略を作成するときは、次の主要指標を十分に考慮する必要があります。

  • 目標復旧時間(RTO): ビジネスに重大な損害を及ぼすことなくシステムやアプリケーションが停止できる最大許容時間。たとえば、1 時間オフラインでもよいアプリケーションもあれば、数分で復旧する必要があるアプリケーションもあります。
  • 目標復旧時点(RPO): 大きなイベント後にオペレーションを再開するために復元する必要があるデータの最長存続期間。RPO は、バックアップの頻度を定義するのに役立ちます。

これらの指標は、中程度から最悪のシナリオまでの潜在的な災害に対して、リスク評価やビジネス インパクト分析(BIA)を実施する際に特に有用です。リスク評価と BIA では、ビジネスのあらゆる機能領域とあらゆるリスクの結果を評価します。これは、DR の目標と、イベント発生前または発生後に DR の目標を達成するために必要なアクションを定義するのに役立ちます。

復旧戦略を作成するときは、RTO と RPO の値を考慮し、これらの値と全体的な目標を達成できる DR パターンを選択することをおすすめします。通常、値を小さくするほど(すなわち、中断後にアプリケーション復旧に必要な時間を短縮するほど)、アプリケーションの実行コストが高くなります。

クラウドの障害復旧では、容量、セキュリティ、ネットワーク インフラストラクチャ、帯域幅、サポート、施設に関するオンプレミスの要件を満たすと、RTO と RPO の費用を大幅に削減できます。Google Cloud 上で高度なマネージド サービスを利用すると、複雑な要素を(すべてとは言わないまでも)ほとんどを回避でき、多くのビジネスの費用を大幅に削減できます。

Google Cloud を使用して障害復旧に対処する方法については、障害復旧計画ガイドをご覧ください。DR 計画の作成については、アカウント マネージャーにお問い合わせください。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。

障害復旧の目的

障害復旧戦略は、多くの重要な点で事業運営の保護に役立ちます。一般的なユースケースを次に示します。

ビジネス レジリエンスの確保

どのような状況が発生しても、優れた DR 計画により、データやトランザクションを失うことなく、ビジネスを迅速に完全な運用状態に戻すことができます。

競争力の維持

オフラインになった事業からは、ほとんどの顧客が離れてしまいます。 顧客は、競合他社から必要な商品やサービスを入手しようとするでしょう。DR 計画によってこうした事態を防げます。

規制リスクの回避

多くの業界には、データの保存場所と保護方法を規定する規制があります。これらの規制に抵触する場合、多額の罰金が科せられます。

データ損失の回避

企業のシステムがダウンしている時間が長くなるほど、データが失われるリスクが高くなります。堅牢な DR 計画により、このリスクを最小限に抑えられます。

顧客満足度の維持

カスタマー サービス レベル契約(SLA)への対応は、常に優先事項です。適切に実行された DR 計画により、課題に直面している企業でも SLA は達成できます。

評価の維持

機能停止後、スムーズに業務が再開できない企業は、ブランド イメージを損なう可能性があります。そのため、確実な DR 計画が重要です。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud