障害復旧(DR)は、障害(自然か、人間の行動(またはエラー)によるものかを問わず)の発生後に IT インフラストラクチャへのアクセスと機能を復元できるようにする組織の機能です。DR はビジネスの継続性のサブセットであると見なされ、重要なビジネス機能をサポートする IT システムが、壊滅的な事態の発生後、可能な限り早期に運用されるようにすることに焦点を当てます。
今日、障害復旧計画はあらゆる企業にとって、特に部分的にまたは完全にクラウド運用している企業にとって非常に重要です。サービスを中断させ、データ損失を引き起こす障害は、警告なしにいつでも発生する可能性があります。例えば、ネットワークが停止する、致命的なバグがリリースされる、自然災害を乗り切る必要がある、などです。堅牢で十分にテストされた障害復旧戦略を採用している組織は、異常が発生した場合に中断による影響を最小限に抑え、迅速に復旧し、コア業務を速やかに再開できます。
Google Cloud のバックアップと障害復旧の機能およびプロダクトと、それらを使用してビジネスに適した DR ソリューションを構築する方法について学習します。
IT 障害復旧とは、自然災害または人為的災害の後に重要な IT インフラストラクチャ、ソフトウェア、システムの運用を復旧または継続するために使用されるポリシー、ツール、プロセスのポートフォリオです。
障害復旧計画で何よりも先に考えなければならないのがクラウドです。クラウドは、ビジネスの継続性と障害復旧の両方に対して最適なソリューションと考えられています。クラウドがあれば、個別の障害復旧データセンター(または復旧サイト)を運用する必要がなくなります。
障害復旧サイトとは
第 2 の物理データセンターであり、構築と保守にコストがかかります。クラウドがあれば不要です。
このような事象はハリケーンのような自然災害の場合もありますが、深刻なシステム障害、意図的な攻撃、さらには人為的なミスによって引き起こされることもあります。
障害の種類には次のようなものがあります。
テクノロジーはビジネスのあらゆる側面においてますます重要な役割を果たしており、アプリケーションやサービスによって企業はより俊敏に、より利用しやすく、より接続しやすくなっています。この傾向は、企業がクラウド コンピューティングを広く採用し、成長、イノベーション、卓越したカスタマー エクスペリエンスを推進するのに寄与しています。
しかし、クラウド環境(パブリック、プライベート、ハイブリッド、マルチクラウド)への移行とリモートで働く従業員の増加により、インフラストラクチャの複雑さが増し、潜在的なリスクが生じています。クラウドベースのシステムの障害復旧は、全体的な事業継続戦略にとって極めて重要です。システムの故障や計画外のダウンタイムが発生すると、物事を円滑に進めるためにクラウドベースのリソース、アプリケーション、ドキュメント、データ ストレージに大きく依存している企業にとって深刻な結果をもたらす可能性があります。
さらに、データ・プライバシーに関する法律や標準により、現在ではほとんどの組織に障害復旧戦略を持つことが義務付けられています。DR 計画に従わないと、コンプライアンス違反や高額な罰金につながる可能性があります。
業種や規模に関係なく、あらゆる企業は、日常の業務を停止させるようなあらゆる事象から迅速に復旧する必要があります。障害復旧計画がなければ、企業はデータの損失、生産性の低下、予算外の出費、イメージの悪化などに見舞われ、客離れや収益の損失につながる可能性があります。
効果的な DR 計画では、復旧のために次の 3 つの要素に対処します。
通常、障害復旧では、セカンダリ ロケーションまたは複数のロケーション(障害復旧サイト)に重要なデータとワークロードを安全に複製し、バックアップします。障害復旧サイトを使用すると、最新のバックアップまたは過去のある時点からデータを復元できます。予期しないイベントが原因でプライマリ ロケーションとそのシステムに障害が発生した場合、プライマリ ロケーションが復旧するまで、DR サイトの使用に切り替えることもできます。
ここでは、障害復旧において最も一般的なテクノロジーと手法をいくつか紹介します。
ビジネスの継続性の強化
ビジネスがオフラインになると、その一瞬一瞬が生産性、カスタマー エクスペリエンス、会社の評判に影響を及ぼします。障害復旧とは、業務の中断を最小限に抑え、あるいは中断することなく復旧できるようにすることで、重要な業務の安全保護対策として役立ちます。
強化されたセキュリティ
DR 計画では、データ バックアップなどの手順を使用してセキュリティ対策を強化し、攻撃やその他のセキュリティ リスクの影響を制限します。たとえば、クラウドベースの障害復旧ソリューションには、高度な暗号化、Identity and Access Management、組織のポリシーなどのセキュリティ機能が組み込まれています。
回復の迅速化
障害復旧ソリューションを使用すると、データとワークロードの復元が容易になるため、壊滅的なイベントが発生しても、ビジネス オペレーションを迅速にオンラインに戻すことができます。DR 計画ではデータ レプリケーションを活用し、多くの場合、ダウンタイムとデータ損失を最小限に抑える自動リカバリを利用しています。
復旧費用の削減
災害が発生した場合の金銭的な影響は、ビジネスや生産性の喪失から、データ プライバシーへのペナルティ、身代金の支払いに至るまで、多岐にわたって甚大になる可能性があります。障害復旧により、このような費用の一部を回避するか、あるいは少なくとも最小限に抑えることができます。Cloud DR プロセスにより、セカンダリ ロケーションの運用と維持にかかる運用コストも削減できます。
高可用性
クラウドベースのサービスの多くは、DR 戦略をサポートする高可用性(HA)機能を備えています。HA 機能は、合意レベルのパフォーマンスを確保し、組み込みの冗長性と自動フェイルオーバーを提供し、機器の故障やデータの可用性に影響する可能性があるその他の小規模なイベントからデータを保護します。
コンプライアンスの強化
DR 計画では、潜在的なリスクを考慮し、障害発生時にデータとワークロードに対して一連の具体的な手順と保護を定義することで、コンプライアンス要件に対応できます。これには通常、強力なデータ バックアップの実施、DR サイト、組織の準備ができていることを確認する DR 計画の定期的なテストが含まれます。
包括的な障害復旧戦略には、緊急対応の詳細な要件、バックアップ オペレーション、復旧手順を含める必要があります。DR 戦略と計画は、多くの場合、広範な事業継続戦略の策定に役立ちます。これには、IT インフラストラクチャとシステム以外の影響を軽減する緊急時対応計画も含まれます。これにより、すべての事業分野が可能な限り早く通常業務を再開できるようになります。
障害復旧戦略を作成するときは、次の主要指標を十分に考慮する必要があります。
これらの指標は、中程度から最悪のシナリオまでの潜在的な災害に対して、リスク評価やビジネス インパクト分析(BIA)を実施する際に特に有用です。リスク評価と BIA では、ビジネスのあらゆる機能領域とあらゆるリスクの結果を評価します。これは、DR の目標と、イベント発生前または発生後に DR の目標を達成するために必要なアクションを定義するのに役立ちます。
復旧戦略を作成するときは、RTO と RPO の値を考慮し、これらの値と全体的な目標を達成できる DR パターンを選択することをおすすめします。通常、値を小さくするほど(すなわち、中断後にアプリケーション復旧に必要な時間を短縮するほど)、アプリケーションの実行コストが高くなります。
クラウドの障害復旧では、容量、セキュリティ、ネットワーク インフラストラクチャ、帯域幅、サポート、施設に関するオンプレミスの要件を満たすと、RTO と RPO の費用を大幅に削減できます。Google Cloud 上で高度なマネージド サービスを利用すると、複雑な要素を(すべてとは言わないまでも)ほとんどを回避でき、多くのビジネスの費用を大幅に削減できます。
Google Cloud を使用して障害復旧に対処する方法については、障害復旧計画ガイドをご覧ください。DR 計画の作成については、アカウント マネージャーにお問い合わせください。
障害復旧戦略は、多くの重要な点で事業運営の保護に役立ちます。一般的なユースケースを次に示します。
ビジネス レジリエンスの確保
どのような状況が発生しても、優れた DR 計画により、データやトランザクションを失うことなく、ビジネスを迅速に完全な運用状態に戻すことができます。
競争力の維持
オフラインになった事業からは、ほとんどの顧客が離れてしまいます。 顧客は、競合他社から必要な商品やサービスを入手しようとするでしょう。DR 計画によってこうした事態を防げます。
規制リスクの回避
多くの業界には、データの保存場所と保護方法を規定する規制があります。これらの規制に抵触する場合、多額の罰金が科せられます。
データ損失の回避
企業のシステムがダウンしている時間が長くなるほど、データが失われるリスクが高くなります。堅牢な DR 計画により、このリスクを最小限に抑えられます。
顧客満足度の維持
カスタマー サービス レベル契約(SLA)への対応は、常に優先事項です。適切に実行された DR 計画により、課題に直面している企業でも SLA は達成できます。
評価の維持
機能停止後、スムーズに業務が再開できない企業は、ブランド イメージを損なう可能性があります。そのため、確実な DR 計画が重要です。