内部パススルーネットワークロードバランサのフェイルオーバー

内部パススルーネットワークロードバランサを構成して、プライマリバックエンドの仮想マシン（VM）インスタンス間で接続トラフィックを分散し、必要に応じてフェイルオーバーバックエンドを使用するように変更できます。フェイルオーバーにより可用性を向上させることができる一方、メインのバックエンド VM が正常に動作していない場合にワークロードをより効率的に管理できます。

このページでは、内部パススルーネットワークロードバランサのフェイルオーバーに固有のコンセプトと要件について説明します。内部パススルーネットワークロードバランサのフェイルオーバーを構成する前に、次の記事のコンセプトを理解しておいてください。

フェイルオーバーを構成すると、内部パススルーネットワークロードバランサの標準のトラフィック分散アルゴリズムが変更されるため、これらのコンセプトを理解しておく必要があります。

デフォルトでは、内部パススルーネットワークロードバランサのバックエンドサービスにバックエンドを追加すると、そのバックエンドはプライマリバックエンドになります。バックエンドは、ロードバランサのバックエンドサービスに追加するときに指定できます。また、後でバックエンドサービスを編集して、フェイルオーバーバックエンドに指定することもできます。フェイルオーバーバックエンドは、構成可能なプライマリ仮想マシンの割合がヘルスチェックの基準を満たさなかったときにのみ、ロードバランサからの接続を受信します。

サポートされているインスタンスグループ

マネージドインスタンスグループと非マネージドインスタンスグループはバックエンドとしてサポートされます。このページでは、非マネージドインスタンスグループの例について説明します。

自動スケーリングとフェイルオーバーでマネージドインスタンスグループを使用したことで、アクティブプールがプライマリバックエンドとフェイルオーバーバックエンドの間でフェイルオーバーとフェイルバックを繰り返している可能性があります。 Google Cloud では、マネージドインスタンスグループによるフェイルオーバー構成を禁じていません。この設定によるデプロイメントが恩恵を受ける可能性があるためです。

アーキテクチャ

次の簡単な例は、1 つのプライマリバックエンドと 1 つのフェイルオーバーバックエンドがある内部パススルーネットワークロードバランサを示しています。

プライマリバックエンドは、us-west1-a にある非マネージドインスタンスグループです。
フェイルオーバーバックエンドは、us-west1-c にある別の非マネージドインスタンスグループです。

内部パススルーネットワークロードバランサのフェイルオーバーの例。 — 内部パススルーネットワークロードバランサのフェイルオーバーの例（クリックして拡大）

次の例は、2 つのプライマリバックエンドと 2 つのフェイルオーバーバックエンドが存在する内部パススルーネットワークロードバランサを示しており、両方のバックエンドが us-west1 リージョンの 2 つのゾーンに分散されています。この構成では、どのプライマリバックエンドもフェイルオーバーバックエンドも 1 つのゾーンに依存しないため、信頼性が向上します。

リージョン固有の考慮事項の詳細については、地域とリージョンをご覧ください。

プライマリバックエンドは、非マネージドインスタンスグループの ig-a と ig-d です。
フェイルオーバーバックエンドは、非マネージドインスタンスグループの ig-b と ig-c です。

マルチゾーンの内部パススルーネットワークロードバランサのフェイルオーバー。 — マルチゾーンの内部パススルーネットワークロードバランサのフェイルオーバー（クリックして拡大）

フェイルオーバーが発生すると、両方のプライマリバックエンドが非アクティブになり、両方のフェイルオーバーバックエンドの正常な VM がアクティブになります。この例のフェイルオーバーの詳しい説明については、フェイルオーバーの例をご覧ください。

バックエンドインスタンスグループと VM

内部パススルーネットワークロードバランサの非マネージドインスタンスグループは、プライマリバックエンドまたはフェイルオーバーバックエンドのいずれかです。バックエンドは、バックエンドサービスに追加するときにフェイルオーバーバックエンドに指定できます。また、追加した後にバックエンドを編集して指定することもできます。それ以外の場合、非マネージドインスタンスグループはデフォルトでプライマリに設定されます。

1 つの内部パススルーネットワークロードバランサで複数のプライマリバックエンドと複数のフェイルオーバーバックエンドを構成するには、これらのバックエンドをロードバランサのバックエンドサービスに追加します。

プライマリ VM は、プライマリバックエンドとして定義したインスタンスグループのメンバーです。ロードバランサがフェイルオーバーバックエンドを使用しない限り、メインのバックエンドの VM はロードバランサのアクティブプールに参加します。

バックアップ VM は、フェイルオーバーバックエンドとして定義したインスタンスグループのメンバーです。プライマリ VM が異常になると、フェイルオーバーバックエンドの VM がロードバランサのアクティブプールに参加します。フェイルオーバーをトリガーする異常な VM の台数は、割合として構成できます。

上限

VM アクティブプールには、最大 250 台の VM を設定できます。つまり、プライマリバックエンドインスタンスグループは最大 250 台のプライマリ VM を設定できます。また、フェイルオーバーバックエンドインスタンスグループには 250 台までのバックアップ VM を設定可能です。
非マネージドインスタンスグループ: 最大 50 個のプライマリバックエンドインスタンスグループと最大 50 個のフェイルオーバーバックエンドインスタンスグループを設定できます。

たとえば、最大限のデプロイを行った場合、5 つのプライマリバックエンドと 5 つのフェイルオーバーバックエンドを設定し、それぞれのインスタンスグループに 50 台の VM を追加できます。

アクティブプール

アクティブプールは、内部パススルーネットワークロードバランサが新しい接続トラフィックを送信する先となるバックエンド VM のコレクションです。アクティブプールのバックエンド VM のメンバーシップはバックエンドの健全性と条件に基づいて自動的に計算されます。フェイルオーバー率で説明するように、これらの条件や健全性は必要に応じて変更可能です。

アクティブプール内で、プライマリ VM とバックアップ VM が混在することはありません。次の図に、メンバーシップの例を示します。フェイルオーバーでは、アクティブプールにバックアップ VM のみが存在します。通常のオペレーション（フェイルバック）では、アクティブプールにプライマリ VM のみが存在します。

フェイルオーバーとフェイルバック

フェイルオーバーとフェイルバックは、バックエンド VM をロードバランサのアクティブプールに切り替える自動プロセスです。 Google Cloud がアクティブプールからプライマリ VM を削除し、正常なフェイルオーバー VM をアクティブプールに追加するプロセスをフェイルオーバーといいます。 Google Cloud がこの逆の処理を行うプロセスをフェイルバックといいます。

フェイルオーバーポリシー

フェイルオーバーポリシーは、 Google Cloudがフェイルオーバーとフェイルバックに使用するパラメータのコレクションです各内部パススルーネットワークロードバランサには、複数の設定を持つ 1 つのフェイルオーバーポリシーがあります。

フェイルオーバー率
すべてのバックエンド VM が正常でない場合のトラフィックのドロップ
フェイルオーバーとフェイルバックでのコネクションドレイン

フェイルオーバー率

構成可能なフェイルオーバー率により、 Google Cloud がフェイルオーバーまたはフェイルバックを実行してアクティブプールのメンバーを変更するタイミングが決まります。この比率は変更可能です。この比率は 0.0 から 1.0 までの範囲で設定できます（両端を含みます）。フェイルオーバー率を指定しない場合、 Google Cloud はデフォルト値の 0.0 を使用します。このデフォルト値ではなく、ユースケースに合わせてフェイルオーバー率を設定することをおすすめします。

条件	アクティブプール内の VM
フェイルオーバー率:（x）`!= 0.0` 正常なプライマリ VM の割合 `>= x` フェイルオーバー率:（x）`= 0.0` 正常なプライマリ VM の台数 `> 0`	すべて正常なプライマリ VM
少なくとも 1 つのバックアップ VM が正常で、かつ: フェイルオーバー率:（x）`!= 0.0` 正常なプライマリ VM の割合 `< x` フェイルオーバー率 `= 0.0` 正常なプライマリ VM の台数 `= 0`	正常なすべてのバックアップ VM
すべてのプライマリ VM とすべてのバックアップ VM が正常でない、かつこの状況でロードバランサがトラフィックをドロップするように構成されていない。	すべてプライマリ VM（最後の手段として使用）

次の例に、アクティブプールのメンバーシップを示しています。計算例については、フェイルオーバーの例を参照してください。

フェイルオーバー率が 1.0 の場合、すべてのプライマリ VM が正常に動作しています。少なくとも 1 つのプライマリ VM が異常終了すると、 Google Cloud はフェイルオーバーを実行し、バックアップ VM をアクティブプールに移動します。
フェイルオーバー率が 0.1 の場合、正常なプライマリ VM の割合が 10% を下回ると、 Google Cloud はフェイルオーバーを実行します。
フェイルオーバー率を 0.0 に設定すると、すべてのプライマリ VM が異常な状態になった場合に限り、 Google Cloud がフェイルオーバーを実行します。正常なプライマリ VM が 1 つでもあれば、フェイルオーバーは実行されません。

内部パススルーネットワークロードバランサは、トラフィック分散アルゴリズムに従ってアクティブプール内の VM 間で接続トラフィックを分散します。

すべてのバックエンド VM が正常でない場合のトラフィックのドロップ

デフォルトでは、すべてのプライマリ VM とバックアップ VM が異常な状態になると、 Google Cloudはプライマリ VM のみに新しい接続を分散します。これは最後の手段です。バックアップ VM は、この最後の接続分散から除外されます。

すべてのプライマリ VM とバックアップ VM が異常な場合に新しい接続トラフィックをドロップするように、内部パススルーネットワークロードバランサを構成できます。

フェイルオーバーとフェイルバックでのコネクションドレイン

コネクションドレインを使用すると、バックエンド VM が異常な状態になってから所定の時間が経過するまで、既存の TCP セッションをアクティブな状態で維持できます。ロードバランサのプロトコルが TCP の場合は、次のことが当てはまります。

デフォルトでは、コネクションドレインが有効になっています。 バックエンド VM が正常に動作しない場合や、ロードバランサのアクティブプールに存在しない場合でも、既存の TCP セッションは最大で 300 秒（5 分）間バックエンド VM で持続します。
フェイルオーバーイベントとフェイルバックイベントの発生中は、コネクションドレインを無効にすることができます。フェイルオーバーやフェイルバック中にコネクションドレインを無効にすると、確立済みの TCP セッションを含むすべての TCP セッションが即座に終了します。バックエンド VM への接続が TCP リセットパケットで終了することもあります。

フェイルオーバーとフェイルバックでコネクションドレインを無効にすると、次のような場合に役立ちます。

バックエンド VM にパッチを適用する。パッチを適用する前に、ヘルスチェックの条件を満たさないプライマリ VM を構成します。これにより、ロードバランサがフェイルオーバーを実行します。コネクションドレインを無効にすると、すべての接続トラフィックが想定どおり迅速にバックアップ VM に移動します。これにより、既存の接続を維持したまま、アップデートをインストールしてプライマリ VM を再起動できます。パッチの適用後、一定台数のプライマリ VM（フェイルオーバー率を参照）がヘルスチェックの条件を満たすと、 Google Cloud がフェイルバックを実行します。
1 台のバックエンド VM でデータの整合性を維持する。プライマリ VM 1 台のみをすべての接続トラフィックの宛先にしなければならない場合は、コネクションドレインを無効にします。これにより、プライマリ VM からバックアップ VM への切り替え時に、既存の接続トラフィックを両方の VM で維持できなくなります。この場合、1 つのバックエンド VM のみを常にアクティブにすることで、データの不整合を回避できます。

フェイルオーバーの例

次の例は、アーキテクチャのセクションで説明したマルチゾーン内部パススルーネットワークロードバランサのフェイルオーバー動作を示しています。

このロードバランサのプライマリバックエンドは、us-west1-a にある ig-a と us-west1-c にある ig-d であり、いずれも非マネージドインスタンスグループです。それぞれのインスタンスグループには 2 台の VM が存在します。どちらのインスタンスグループの VM もすべてプライマリ VM です。

ig-a にある vm-a1
ig-a にある vm-a2
ig-d にある vm-d1
ig-d にある vm-d2

このロードバランサのフェイルオーバーバックエンドは、us-west1-a にある ig-b と us-west1-c にある ig-c であり、いずれも非マネージドインスタンスグループです。それぞれのインスタンスグループには 2 台の VM が存在します。どちらのインスタンスグループの VM もすべてバックアップ VM です。

ig-b にある vm-b1
ig-b にある vm-b2
ig-c にある vm-c1
ig-c にある vm-c2

正常なプライマリ VM の台数が 2 未満の場合に、この接続がバックアップ VM に配信されるように、ロードバランサのフェイルオーバーポリシーを構成するとします。まず、フェイルオーバー率を 0.5（50%）に設定します。 Google Cloud は、フェイルオーバー率にプライマリ VM の台数を掛けて、正常なプライマリ VM の最低台数を計算します（計算式: 4 × 0.5 = 2）。

4 台のプライマリ VM がすべて正常な場合、 Google Cloud はすべてのホストに新しい接続を割り当てます。プライマリ VM がヘルスチェックの条件を満たさない場合は、次のように処理されます。

vm-a1 と vm-d1 が正常に動作していない場合、 Google Cloud によって残りの 2 台の正常なプライマリ VM（vm-a2 と vm-d2）に新しい接続トラフィックが分散されます。これは、正常なプライマリ VM が最低台数以上存在するためです。
vm-a2 もヘルスチェックの条件を満たさず、正常なプライマリ VM が vm-d2 1 台だけになった場合、 Google Cloud は、正常なプライマリ VM の数が最低台数より少ないことを認識して、フェイルオーバーを実行します。アクティブプールは 4 つの正常なバックアップ VM に設定されます。新しい接続トラフィックは 4 つのインスタンスグループに分散されます（インスタンスグループ ig-b と ig-c。vm-d2 は正常ですが、アクティブプールから削除されるため、新しい接続トラフィックは受信しません。
vm-a2 が復旧してヘルスチェックの条件を満たすと、 Google Cloud は正常なプライマリ VM が 2 台以上存在することを認識し、フェイルバックを実行します。アクティブプールは 2 つのプライマリ VM（vm-a2 と vm-d2）に設定され、新しい接続トラフィックが分散されます。バックアップ VM はすべてアクティブプールから削除されます。
他のプライマリ VM が復旧し、ヘルスチェックに合格すると、 Google Cloudはこの VM をアクティブプールに追加します。たとえば、vm-a1 が正常な状態になると、Google Cloud はアクティブプールを 3 台の正常なプライマリ VM（vm-a1、vm-a2、vm-d2）に設定し、新しい接続トラフィックを分散します。

次のステップ

フェイルオーバーを使用する内部パススルーネットワークロードバランサを構成してテストする。内部パススルーネットワークロードバランサにフェイルオーバーを構成するをご覧ください。
内部パススルーネットワークロードバランサを構成してテストする。内部パススルーネットワークロードバランサを設定するをご覧ください。
内部パススルーネットワークロードバランサの問題をトラブルシューティングする。内部パススルーネットワークロードバランサをトラブルシューティングするをご覧ください。

内部パススルー ネットワーク ロードバランサのフェイルオーバー

サポートされているインスタンス グループ