データ分析

BigQuery のマネージド障害復旧により複数のリージョン間でビジネスの継続性を維持

2024年5月31日

Larry Henderson

Product Manager

Brian Welcker

Director, Product Management

Gemini 1.5 モデルをお試しください。

Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダルモデルです。

試す

※この投稿は米国時間 2024 年 5 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。

地理冗長は、復元力に優れたクラウドベースのデータ戦略を構築するうえでの基盤となります。BigQuery は長年にわたり、単一の地理的リージョン内の可用性において、業界をリードする 99.99% の稼働時間のサービスレベル契約（SLA）を提供してきました。単一リージョン内にある 2 つのデータセンター間における完全な冗長性は、作成するすべての BigQuery データセットに含まれ、完全に透過的な方法で管理されます。

複数の広い地理的リージョン全体で冗長性を高めたいお客様に向けて、BigQuery にマネージド障害復旧が導入されることとなりました。この機能は、コンピューティングとストレージの自動フェイルオーバーを可能にし、ビジネスクリティカルなワークロードに合わせた新しいクロスリージョンの SLA を提供するもので、現在プレビュー版をご利用いただけます。この機能を利用すると、リージョン全体でのインフラストラクチャの停止という稀な状況が発生した場合でも、ビジネスの継続性を維持できます。マネージド障害復旧では、容量予約のためのフェイルオーバー構成も提供されているため、クエリとストレージのフェイルオーバー動作を管理できます。この機能は、BigQuery Enterprise Plus エディションでご利用いただけます。

仕組み

BigQuery Enterprise Plus エディションをご利用のお客様は、容量の予約を構成することで、異なる地理的リージョン間の自動フェイルオーバーを有効にできます。フェイルオーバー予約は、BigQuery のクロスリージョンデータセットレプリケーションを拡張したもので、データリソースとコンピューティングリソースの両方のロケーションを障害復旧イベント中に確実に連携動作させます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_fRF1oyb.max-900x900.png

Enterprise Plus エディションの予約のセカンダリリージョンにおけるスロット容量は、追加料金なしで自動的にプロビジョニングおよび管理されます。競合製品の中には、ユーザーがコンピューティングクラスタをセカンダリロケーションに複製しなければならないものもあります。

リージョン全体のサービスが停止した場合、コンピューティングとデータの両方に対して、セカンダリリージョンをプライマリロールに昇格できます。BigQuery のクエリルーティングレイヤにより、フェイルオーバーは、エンドユーザーやツールによる操作なしで完全に透過的に行われます。

プライマリ リージョン: データセットの現在のプライマリレプリカを含むリージョンです。これは、データセットのデータを変更（読み込み、DDL、DML など) 可能なリージョンでもあります。
セカンダリ リージョン: リージョンが停止した場合にフェイルオーバー予約のスタンバイ容量と複製されたデータセットが利用可能なリージョンです。
フェイルオーバー予約: プライマリ / セカンダリリージョンのペアで構成される Enterprise Plus エディションの予約です。注: データセットはフェイルオーバー予約に関連付けられます。

プライマリリージョンのデータセットレプリカがプライマリレプリカ、セカンダリリージョンのデータセットレプリカがセカンダリレプリカとなります。これらのロールは、フェイルオーバーのプロセス中に入れ替えられます。

プライマリレプリカは書き込み可能で、セカンダリレプリカは読み取り専用です。プライマリレプリカへの書き込みは、セカンダリレプリカに非同期で複製されます。各リージョン内では、データが 2 つのゾーンに冗長的に保存されます。ネットワークトラフィックが Google Cloud ネットワークの外部に出ることはありません。

リージョンペアとは

BigQuery のマネージド障害復旧のリージョンペアは、ターボレプリケーションとコンピューティングの冗長性によって地理的にサポートされたリージョンのペアです。BigQuery は、定義されたリージョンペア内の 2 つのリージョン間でデータを複製し、セカンダリの利用可能な容量を管理します。このレプリケーションにより、BigQuery のマネージド障害復旧でデータの高い可用性と耐久性が提供されます。お客様は、フェイルオーバー予約で希望するリージョンペア（サポートされているリージョンに基づく）を定義できます。

サポートされているリージョンペア

BigQuery のマネージド障害復旧機能では、特定のリージョンペア間（Cloud Storage と同様に、地理的エリア内の複数のリージョン）でのフェイルオーバー予約がサポートされます。ペアのどちらのリージョンも、初期のプライマリリージョンまたはセカンダリリージョンとして指定できます。

セカンダリリージョンの容量

BigQuery では、フェイルオーバーの 5 分以内に、プライマリリージョンの容量がセカンダリリージョンで利用可能になることが保証されます。この保証は、使用されているかどうかにかかわらず、予約のベースラインに適用されます。また、プライマリで提供されるのと同じレベルの自動スケーリングも提供されます。

料金について

BigQuery のマネージド障害復旧は、Enterprise Plus エディションでご利用いただけます。セカンダリリージョンのスタンバイコンピューティング容量は、スロット時間あたりの料金に含まれており、スタンバイ容量を個別に購入する必要はありません。オプションとして、読み取り専用クエリ用に、セカンダリリージョンに追加の Enterprise Plus 予約をプロビジョニングすることも可能です。

マネージド障害復旧をご利用のお客様への請求は、プライマリリージョンとセカンダリリージョンの関連付けられたデータセットの複製されたストレージに対して行われます。一般提供時には、この機能はリージョン間のデータ転送に自動的にターボレプリケーションを使用します。

SKU	課金方法
Enterprise Plus エディション	スロット時間あたり $0.10（米国の料金例）
ストレージ	セカンダリリージョンのストレージバイト数は、プライマリリージョンのストレージバイト数と同じ正規料金で課金されます。詳細については、BigQuery のストレージの料金をご覧ください。
データ移転	マネージド障害復旧はターボレプリケーションを使用します* 複製中に使用されるデータ転送は、次のように課金されます。物理バイトごと複製された物理的な GB ごと注: ターボレプリケーションの料金は「デフォルトのレプリケーション」の 2 倍です

* ターボ レプリケーションはプレビュー期間中はご利用いただけませんが、一般提供（GA）時に自動的に有効になります。

目標復旧時間（RTO）

プライマリリージョンが停止した場合でも、セカンダリの予約と、関連付けられたデータセットの昇格が 5 分以内に行われます。実行中のクエリはすべてキャンセルされ、RTO タイムライン中は拒否されます。

目標復旧時点（RPO）

サポートされているリージョンペア間でフェイルオーバー予約で構成されているセカンダリデータセットレプリカのデータは、ターボレプリケーションが有効で、初期レプリケーションが完了している場合、最長でも 15 分前のものです（バックフィルとも呼ばれます）。

注: ターボ レプリケーションと SLA での RPO / RPO は、プレビュー期間中は適用されません。

構成の実例

プレビュー期間中は、マネージド障害復旧の構成は BigQuery コンソール（UI）と SQL でサポートされます。次のワークフローは、BigQuery でマネージド障害復旧を設定および管理する方法を示しています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Image_2_-_Second_image_on_blog.max-900x900.png

特定のデータセットのレプリカを作成する

データセットを複製するには、ALTER SCHEMA ADD REPLICA DDL ステートメントを使用します。

レプリカを追加した後、最初のコピーオペレーションが完了するまで時間がかかります。データの複製中も、プライマリレプリカを参照するクエリを実行できます。クエリの処理能力が低下することはありません。

読み込んでいます...

フェイルオーバー予約を構成し、データセットを関連付ける

まず、フェイルオーバー予約を作成し、そのセカンダリロケーションを指定します。セカンダリロケーションは、既存の Enterprise Plus 予約にも指定できます。

読み込んでいます...

次に、1 つ以上のデータセットをフェイルオーバー予約に関連付けます。データセットは、予約で指定されたプライマリ / セカンダリリージョンに複製される必要があります。

読み込んでいます...

フェイルオーバー予約とセカンダリのデータセットを昇格させる

予約と、関連付けられたデータセットをフェイルオーバーします。これは、セカンダリリージョンから実行する必要があります。

読み込んでいます...

元のプライマリにフェイルバックする

予約と、関連付けられたデータセットをフェイルバックします（新しいセカンダリ / 古いプライマリから実行）。

読み込んでいます...

使ってみる

ミッションクリティカルなデータ環境を運用する企業にとって、ビジネスの継続性は最重要事項です。BigQuery のマネージド障害復旧機能のプレビュー版をぜひお試しください。マネージド障害復旧の詳細と BigQuery で使用を開始する方法については、マネージド障害復旧クイックスタートをご覧ください。

-プロダクトマネージャー Larry Henderson

-プロダクト管理担当ディレクター Brian Welcker

投稿先

https://storage.googleapis.com/gweb-cloudblog-publish/images/DO_NOT_USE_CUxs9oC.max-700x700.jpg

Data Analytics

Cloud Data Fusion のインスタンスとパイプラインへのアクセスを制限する 3 つの方法

執筆者: Deepinder Dhuria • 所要時間: 11 分

Data Analytics

Datastream の新しいストリーム復元機能を発表

執筆者: Etai Margolin • 所要時間: 4 分

Data Analytics

新たなバベルの塔？BigQuery での多言語エンベディングとベクトル検索の活用

執筆者: Layolin Jesudhass • 所要時間: 4 分

Data Analytics

BigQuery のベクター検索と LLM でログ分析を強化

執筆者: Roy Arsan • 所要時間: 11 分

BigQuery のマネージド障害復旧により複数のリージョン間でビジネスの継続性を維持

Larry Henderson

Brian Welcker

Gemini 1.5 モデル をお試しください。

仕組み

リージョンペアとは

サポートされているリージョンペア

セカンダリ リージョンの容量

料金について

目標復旧時間（RTO）

目標復旧時点（RPO）

構成の実例

使ってみる

関連記事

Cloud Data Fusion のインスタンスとパイプラインへのアクセスを制限する 3 つの方法

Datastream の新しいストリーム復元機能を発表

新たなバベルの塔？BigQuery での多言語エンベディングとベクトル検索の活用

BigQuery のベクター検索と LLM でログ分析を強化

Gemini 1.5 モデルをお試しください。

セカンダリリージョンの容量