コンテンツに移動
データ分析

BigQuery のソフト フェイルオーバーの導入: 障害復旧テストの制御を強化

2025年9月11日
Larry Henderson

Sr. Product Manager

Rohit Ray

Group Product Manager

※この投稿は米国時間 2025 年 9 月 4 日に、Google Cloud blog に投稿されたものの抄訳です。

ミッション クリティカルなワークロードを持つほとんどの企業は、データをセカンダリ ロケーションに複製してから、障害発生時にそのロケーションへのフェイルオーバーを可能にするという、二重の障害復旧ソリューションを導入しています。BigQuery の場合、そのソリューションは BigQuery マネージド障害復旧という形になります。しかし、障害復旧イベントのテスト中にデータが失われるリスクは、依然として大きな懸念事項です。従来の「ハード フェイルオーバー」ソリューションと同様に、難しい選択を迫られます。セカンダリをすぐに昇格させて目標復旧時点(RPO)内のデータを失うリスクを負うか、オンラインに戻らない可能性もあるプライマリ リージョンを待って復旧を遅らせるかです。

このたび、BigQuery マネージド障害復旧にソフト フェイルオーバーが導入され、この問題に直接対処できるようになりましたソフト フェイルオーバー ロジックは、レプリケーションが完了したことが確認された後にのみ、セカンダリ リージョンのコンピューティングとデータセットを昇格させます。これにより、障害復旧の移行を完全に制御でき、計画されたフェイルオーバー中のデータ損失のリスクを最小限に抑えることができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_uEPt3jW.max-2000x2000.png

図 1: ハード フェイルオーバーとソフト フェイルオーバーの比較

ハード フェイルオーバーとソフト フェイルオーバーの違いの概要

 

ハード フェイルオーバー

ソフト フェイルオーバー

ユースケース

計画外のサービス停止、リージョンのダウン

フェイルオーバー テスト。プライマリとセカンダリの両方が利用可能である必要がある

フェイルオーバーのタイミング

プライマリとセカンダリ間の保留中のレプリケーションを無視して、できるだけ早く。データ損失の可能性あり

プライマリとセカンダリの同意が必要で、データ損失の可能性を最小限に抑える

RPO / RTO

15 分 / 5 分*

なし

*構成によってサポートされる目標が異なります

BigQuery のソフト フェイルオーバーの動作

ミッション クリティカルな分析とレポートに BigQuery を使用している大手金融サービス会社「SecureBank」を想像してみてください。SecureBank は、堅牢な障害復旧を最優先事項としているため、主要な BigQuery データセットに対して信頼性の高い目標復旧時間(RTO)と 15 分の目標復旧時点(RPO)を求めています。同社は、BigQuery マネージド DR を使用して定期的に DR ドリルを実施し、コンプライアンスを保ち、予期せぬサービス停止へ備えています。

BigQuery マネージド DR の BigQuery でソフト フェイルオーバーが導入される前、SecureBank は DR ドリルをどのように実施するかというジレンマに直面していました。BigQuery マネージド DR はコンピューティングと関連するデータセットのフェイルオーバーを処理しますが、完全な「ハード フェイルオーバー」の訓練を行うということは、フェイルオーバーが開始されたときにレプリケーションが完了していなければ、最大 15 分のデータ損失のリスクを受け入れることを意味します。また、最初にリージョン間のデータ同期を手動で検証する場合は、運用上の大きな混乱が生じる可能性があります。多くの場合、現実的でない、または複雑なドリルになり、貴重なエンジニアリング時間が費やされ、不安が生じていました。

新しいソリューション

BigQuery マネージド DR のソフト フェイルオーバーでは、管理者はフェイルオーバー手順について複数のオプションを利用できます。計画外の停止に対するハード フェイルオーバーとは異なり、ソフト フェイルオーバーでは、すべてのデータがセカンダリ リージョンにレプリケートされた後にのみフェイルオーバーが開始されるため、データの完全性が保証されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_30xTyZV.max-1900x1900.png

図 2: ソフト フェイルオーバー モードの選択

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_twcZRCh.max-1900x1900.png

図 3: 障害復旧の予約

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_w62xniT.max-1900x1900.png

図 4: レプリケーションのステータス / フェイルオーバーの詳細

BigQuery のソフト フェイルオーバー機能は、BigQuery UI、DDL、CLI を介して現在利用可能であり、テスト中にデータ損失のリスクを負うことなく、障害復旧、確実なシミュレーション、コンプライアンスのためのエンタープライズ グレードの制御を提供します。今すぐご利用になり、稼働時間の維持、データ損失の防止、シナリオの安全なテストを実現しましょう。

ー シニア プロダクト マネージャー、Larry Henderson

ー グループ プロダクト マネージャー、Rohit Ray

投稿先