高度なロードバランシング最適化

このページでは、アプリケーションロードバランサとプロキシネットワークロードバランサの費用、レイテンシ、復元性を高度に最適化する構成方法について説明します。

Cloud Service Mesh も高度なロードバランシング最適化をサポートしています。詳細については、Cloud Service Mesh ドキュメントの高度なロードバランシングの概要をご覧ください。

Cloud Load Balancing には、次の高度な機能が備わっています。

サービスロードバランシングポリシー: サービスロードバランシングポリシー（serviceLbPolicy）は、ロードバランサのバックエンドサービスに関連付けられているリソースです。サービスロードバランシングポリシーを使用すると、バックエンドサービスに関連付けられたバックエンド内でのトラフィックの分散方法に影響する次のパラメータをカスタマイズできます。
- ロードバランシングアルゴリズム: 特定のリージョンまたはゾーン内でのトラフィックの分散方法を決めるロードバランシングアルゴリズムをカスタマイズします。
- 自動容量ドレイン: 自動容量ドレインを有効にすると、ロードバランサが異常なバックエンドからトラフィックを速やかにドレインします。
- フェイルオーバーのしきい値: フェイルオーバーのしきい値を設定して、バックエンドを異常と判断するタイミングを決定します。異常と判断されると、異常なバックエンドを回避するため、トラフィックが別のバックエンドにフェイルオーバーされます。
- トラフィックの分離: リージョン間のトラフィックのオーバーフローを制限または禁止することにより、連鎖的な障害を防止します。
優先バックエンド: 特定のバックエンドを優先バックエンドとして指定できます。この優先バックエンドが容量に達すると、残りのバックエンドにリクエストが送信されます。

次の図は、Cloud Load Balancing がルーティング、ロードバランシング、トラフィック分散を判断する仕組みを示しています。

Cloud Load Balancing がルーティングとトラフィック分散を決定する仕組み。

始める前に

このページの内容を確認する前に、外部アプリケーションロードバランサの概要ページにあるリクエストの分散プロセスをよく確認してください。常にプレミアムティアにあるロードバランサの場合、第 1 候補のリージョンがすでにいっぱいであれば、このページで説明しているすべてのロードバランシングアルゴリズムにおいて、リージョン間の振り分けがサポートされます。

サポートされているロードバランサとバックエンド

次のロードバランサは、サービスロードバランシングポリシーと優先バックエンドをサポートしています。

グローバル外部アプリケーションロードバランサ
クロスリージョン内部アプリケーションロードバランサ
グローバル外部プロキシネットワークロードバランサ
クロスリージョン内部プロキシネットワークロードバランサ

このページで説明している機能には、バランシングモードをサポートする互換性のあるバックエンドが必要です。次の表にサポートされているバックエンドをまとめています。

バックエンド	サポート対象
インスタンスグループ	ゾーン非マネージドインスタンスグループとゾーンマネージドインスタンスグループはサポートされていますが、リージョンマネージドインスタンスグループはサポートされていません。
ゾーン NEG（`GCE_VM_IP_PORT` エンドポイント）
ゾーン NEG（`GCE_VM_IP` エンドポイント）	このタイプの NEG は、アプリケーションロードバランサとプロキシネットワークロードバランサではサポートされていません。
ハイブリッド NEG（`NON_GCP_PRIVATE_IP_PORT` エンドポイント）
サーバーレス NEG
インターネット NEG
Private Service Connect NEG

ロードバランシングアルゴリズム

このセクションでは、サービスロードバランシングポリシーで構成できるロードバランシングアルゴリズムについて説明します。アルゴリズムを構成しない場合や、サービスのロードバランシングポリシーをまったく構成しない場合、ロードバランサはデフォルトの WATERFALL_BY_REGION を使用します。

リージョンごとのウォーターフォール

WATERFALL_BY_REGION は、デフォルトのロードバランシングアルゴリズムです。このアルゴリズムを使用すると、ユーザーに最も近いリージョン内のすべての Google Front End（GFE）が、構成されたターゲット容量（容量スケーラーによって変更可能）に比例してバックエンドの選択を試みます。

2 番目のレイヤの GFE は、2 番目のレイヤの GFE に可能な限り近いゾーン（ネットワークのラウンドトリップ時間で定義）のバックエンドインスタンスまたはエンドポイントを優先的に選択します。WATERFALL_BY_REGION はゾーン間のレイテンシを最小限に抑え、リクエスト率が低いため、2 番目のレイヤの GFE は、2 番目のレイヤの GFE 優先ゾーンのバックエンドにリクエストを排他的に送信する可能性があります。

最も近いリージョン内のすべてのバックエンドが構成された容量の上限で実行されている場合、ネットワークレイテンシを最適化しながら、次に最も近いリージョンにトラフィックがオーバーフローし始めます。

リージョンへのスプレー

SPRAY_TO_REGION アルゴリズムは、2 番目のレイヤの GFE が 2 番目のレイヤの GFE に可能な限り近いゾーンにあるバックエンドインスタンスまたはエンドポイントを優先的に選択しないように、2 番目のレイヤの GFE の動作を変更します。SPRAY_TO_REGION を使用すると、2 番目のレイヤの GFE は、リージョン内のすべてのゾーンのすべてのバックエンドインスタンスまたはエンドポイントにリクエストを送信します。2 番目のレイヤの GFE とバックエンドインスタンスまたはエンドポイント間のラウンドトリップ時間が短いほうが優先されることはありません。

WATERFALL_BY_REGION と同様に、リージョン内の 2 番目のレイヤのすべての GFE が、構成されたターゲット容量（容量スケーラーによって変更可能）に比例してバックエンドの選択を行います。

SPRAY_TO_REGION は、特にリクエスト率が低い場合、リージョン内のすべてのゾーンのバックエンド間でより均一な分散を行いますが、この均一な分散には次の考慮事項があります。

バックエンドが停止しても、ヘルスチェックに引き続き合格している場合、2 番目のレイヤで影響を受ける GFE は多くなりますが、個々の影響はそれほど深刻ではありません。
2 番目のレイヤの各 GFE に優先ゾーンがないため、2 番目のレイヤの GFE は、より多くのゾーン間トラフィックを生成します。処理されるリクエスト数によっては、2 番目のレイヤの GFE がそれぞれバックエンドへの TCP 接続を確立する場合があります。

ゾーンごとのウォーターフォール

WATERFALL_BY_ZONE アルゴリズムは、2 番目のレイヤの GFE が 2 番目のレイヤの GFE に可能な限り近いゾーンにあるバックエンドインスタンスまたはエンドポイントを優先的に選択するように、2 番目のレイヤの GFE の動作を変更します。WATERFALL_BY_ZONE を使用すると、2 番目のレイヤの GFE が最も優先されるゾーンのバックエンドインスタンスまたはエンドポイントをすべて選択した場合（または比較的過剰に選択した場合）、2 番目のレイヤの GFE は、リージョン内の他のゾーンのバックエンドインスタンスまたはエンドポイントにのみリクエストを送信します。

WATERFALL_BY_ZONE アルゴリズムは、次の点を考慮しながらレイテンシを最小限に抑えます。

WATERFALL_BY_ZONE は、本質的にゾーン間の接続を最小化しません。このアルゴリズムはレイテンシのみによってステアリングされます。
WATERFALL_BY_ZONE では、2 番目のレイヤの GFE が最優先のゾーンを充填してから他のゾーンを充填するとは限りません。メンテナンスイベントにより、2 番目のレイヤの GFE からのすべてのトラフィックが、別のゾーンのバックエンドインスタンスまたはエンドポイントに一時的に送信される可能性があります。
WATERFALL_BY_ZONE では、リージョン内のすべてのバックエンドインスタンスまたはエンドポイント間でリクエストが均一に分散されない可能性があります。たとえば、2 番目のレイヤの GFE の最優先ゾーンのバックエンドインスタンスまたはエンドポイントが容量に達したときに、他のゾーンのバックエンドが容量に達していない能性があります。

ロードバランシングアルゴリズムを比較する

次の表に、ロードバランシングアルゴリズムの比較を示します。

動作	リージョンごとのウォーターフォール	リージョンへのスプレー	ゾーンごとのウォーターフォール
単一リージョン内で容量使用量を均一化	○	はい	×
複数のリージョンで使用量を均一化	×	いいえ	×
ロードバランサからのトラフィック分割を均一化	×	はい	×
ゾーン間のトラフィック分散	○:トラフィックは、ネットワークレイテンシを最適化しながら、リージョン内のゾーンに均等に分散されます。必要に応じて、トラフィックがゾーン間で送信されることがあります。	○	○:トラフィックは、容量に達するまで最も近いゾーンに送信されます。その後、次に近いゾーンに送信されます。
ローカルゾーンでのトラフィック急増に対する感度	平均的。ゾーン間のバランスをとるために、すでに行われたトラフィックシフトの量によって異なります。	低め。単一ゾーンでの急増がリージョン内のすべてのゾーンに広がります。	高め。ロードバランサが対応できるようになるまで、単一ゾーンでの急増は同じゾーンで処理される可能性が高くなります。

自動容量ドレインと自動容量ドレイン解除

自動容量ドレインとドレイン解除は、ヘルスチェックとバックエンド容量のコンセプトを組み合わせたものです。自動容量ドレインでは、ヘルスチェックが追加のシグナルとして使用され、有効なバックエンド容量がゼロに設定されます。自動容量ドレインでは、有効なバックエンド容量を以前の値に戻すための追加のシグナルとして、ヘルスチェックが使用されます。

自動容量ドレインとドレイン解除を行わずに、特定のリージョン内のすべてのバックエンドからリクエストを転送する場合は、そのリージョン内の各バックエンドの有効な容量を手動でゼロに設定する必要があります。たとえば、容量スケーラーを使用してこれを行うことができます。

自動容量ドレインとドレイン解除では、ドレインまたはドレイン解除によってバックエンドの容量を調整するシグナルとしてヘルスチェックを使用できます。

自動容量ドレインとドレインの解除を有効にするには、サービスロードバランシングポリシーを構成するをご覧ください。

自動容量ドレイン

自動容量ドレインは、すべてのバックエンドインスタンスグループまたは NEG に対するドレイン可能な候補バックエンドインスタンスグループまたは NEG の比率が 50% 未満である限り、各ドレイン可能な候補バックエンドインスタンスグループまたは NEG の容量をゼロに設定します。50% の比率を計算する場合、容量がゼロのバックエンドは分母に含まれません。ただし、すべてのバックエンドが分母に含まれます。

ドレイン可能な候補バックエンドは、メンバーインスタンスまたはエンドポイントの 25% 未満がロードバランサのヘルスチェックに合格しているバックエンドインスタンスグループまたは NEG です。

容量がゼロのバックエンドには、次のようなものがあります。

メンバーインスタンスのないバックエンドインスタンスグループ。インスタンスグループの容量はインスタンスごとに定義されます
メンバーエンドポイントのないバックエンド NEG。NEG の容量はエンドポイントごとに定義されます
容量スケーラーをゼロに設定したバックエンドインスタンスグループまたは NEG

自動的にドレインされるバックエンド容量は、容量スケーリング値を設定せずに、バックエンドの backendService.backends[].capacityScaler を手動で 0 に設定するのと同じ機能です。

自動容量ドレイン解除

自動容量ドレイン解除は、バックエンドのインスタンスまたはエンドポイントの 35% 以上が 60 秒間ヘルスチェックに合格すると、バックエンドの容量を、バックエンドの容量スケーラーによって制御される値に戻します。60 秒の要件により、ヘルスチェックが失敗した直後に合格した場合に、ドレインとドレインの解除が連続して発生する可能性が低くなります。

フェイルオーバーのしきい値

ロードバランサは、バックエンド間のトラフィックの分散をマルチレベルで決定します。安定状態では、前述のロードバランシングアルゴリズムのいずれかに基づいて選択されたバックエンドにトラフィックを送信します。このようなバックエンドは、プライマリバックエンドと呼ばれ、レイテンシと容量の観点から最適と見なされます。

ロードバランサは、プライマリバックエンドが異常でトラフィックを処理できなくなった場合に使用できる他のバックエンドも追跡します。これらのバックエンドは、フェイルオーバーバックエンドと呼ばれます。これらのバックエンドは通常、残り容量のある近くのバックエンドです。

プライマリバックエンドのインスタンスまたはエンドポイントが異常な状態になっても、ロードバランサはトラフィックを他のバックエンドにすぐには移行しません。代わりに、ロードバランサはまず同じバックエンド内の他の正常なインスタンスまたはエンドポイントにトラフィックをシフトして、トラフィックの負荷を安定させます。プライマリバックエンドの多くのエンドポイントが異常な状態で、同じバックエンド内の残りのエンドポイントが追加のトラフィックを処理できない場合、ロードバランサはフェイルオーバーしきい値を使用して、フェイルオーバーバックエンドへのトラフィック送信を開始するタイミングを決定します。ロードバランサは、フェイルオーバーしきい値までプライマリバックエンドの異常を許容します。その後、トラフィックはプライマリバックエンドからシフトされます。

フェイルオーバーのしきい値は 1～99 の値で、正常である必要のあるバックエンドのエンドポイントの割合で表します。正常なエンドポイントの割合がフェイルオーバーしきい値を下回ると、ロードバランサはフェイルオーバーバックエンドにトラフィックを送信しようとします。デフォルトのフェイルオーバーしきい値は 70 です。

フェイルオーバーしきい値の設定が高すぎると、一時的な健全性の変化で不要なトラフィック流出が発生する可能性があります。フェイルオーバーしきい値の設定が低すぎると、異常なエンドポイントが多数あっても、ロードバランサはプライマリバックエンドにトラフィックを送信し続けます。

フェイルオーバーの決定はローカライズされています。ローカルの Google Front End（GFE）が互いに独立して動作します。フェイルオーバーバックエンドが追加のトラフィックを処理できるようにする責任はユーザー側にあります。

フェイルオーバートラフィックにより、バックエンドが過負荷になる可能性があります。バックエンドが正常でない場合でも、ロードバランサがトラフィックを送信することがあります。使用可能なバックエンドのプールから異常なバックエンドを除外するには、自動容量ドレイン機能を有効にします。

トラフィック分離

デフォルトでは、Cloud Load Balancing は WATERFALL_BY_REGION アルゴリズムを使用して、ユーザートラフィックのルーティング先を決定します。WATERFALL_BY_REGION では、ユーザーに最も近いリージョンのバックエンドがフルまたは異常な状態の場合、トラフィックは他のリージョンにオーバーフローします。トラフィック分離を有効にすると、ロードバランサはそのリージョン内のすべてのバックエンドが構成された容量の最大上限で実行されている場合でも、ユーザーに最も近いリージョンにのみトラフィックを転送できます。トラフィック分離を有効にすると、リージョンでの連鎖的な障害を防ぎ、サービス停止が発生する可能性を 1 つのリージョン内に限定できます。

トラフィック分離は、サービスロードバランシングポリシーの一部として構成されます。使用できる分離モードは次の 2 種類があります。

NEAREST（デフォルト）: ロードバランサ（接続を処理する第 2 レイヤの GFE または Envoy プロキシ）は、ユーザーに最も近いリージョンのバックエンドにトラフィックを送信します。最も近いリージョンにバックエンドが構成されていない場合、または最も近いリージョンのバックエンドが異常な状態の場合、ネットワークレイテンシを最適化しつつ、次に最も近いリージョンにトラフィックをルーティングします。これは各リージョンで処理容量がなくなるまで継続されます。

NEAREST 分離モードは、サポートされているロードバランサすべてで使用できます。
STRICT: ロードバランサ（接続を処理する Envoy プロキシ）は、ユーザーに最も近いリージョンのバックエンドにのみトラフィックを送信します。最も近いリージョンにバックエンドが構成されていない場合、または最も近いリージョンのバックエンドが異常な状態でリクエストを処理できない場合、トラフィックが破棄され、リクエストが失敗するようになります。

STRICT 分離モードは、クロスリージョン内部アプリケーションロードバランサとクロスリージョン内部プロキシネットワークロードバランサでのみ使用できます。

分離なし

次の図は、トラフィック分離が有効になっていない場合のクロスリージョンロードバランサの動作を示しています。

トラフィック分離が有効になっていない場合の Cloud Load Balancing の動作。

Nearest

次の図は、トラフィック分離が NEAREST モードで有効になっている場合のクロスリージョンロードバランサの動作を示しています。

Strict

次の図は、トラフィック分離が STRICT モードで有効になっている場合のクロスリージョンロードバランサの動作を示しています。

次の点に注意したうえで、この機能を有効にしてください。

あるリージョン内のバックエンドが過負荷になっている場合、他のリージョンのバックエンドがトラフィックを処理できる場合でも、ロードバランサはそのリージョン内のバックエンドに追加のトラフィックを送信することがあります。つまり、各個別のリージョンのバックエンドが追加のトラフィックにより過負荷になる可能性が高くなるため、それに応じた計画が必要になります。
分離を有効にしても、トラフィックは引き続きグローバルコントロールプレーンでルーティングされます。つまり、複数のリージョンでグローバルな障害が発生する可能性は残ります。インフラストラクチャレベルでの分離を強化するには、リージョンロードバランサを選択してください。

トラフィック分離モードを構成する際には、REGION に分離の粒度も設定する必要があります。これにより、リージョン間トラフィックのオーバーフローを防止できます。粒度が構成されていない場合、トラフィック分離は行われません。トラフィック分離を有効にする方法については、サービスロードバランシングポリシーを構成するをご覧ください。

優先バックエンド

優先バックエンドとは、トラフィックを他のバックエンドにスピルオーバーする前に容量を完全に使用するバックエンドです。優先バックエンドで構成された容量を超えるトラフィックは、残りの非優先バックエンドに転送されます。ロードバランシングアルゴリズムは、バックエンドサービスの非優先バックエンド間でトラフィックを分散します。

後続のリクエストを残りのバックエンドに転送する前に、バックエンドサービスに接続されているバックエンドを完全に使用するように、ロードバランサを構成できます。

優先バックエンドを使用する場合は、次の制限事項を考慮してください。

優先バックエンドとして構成されたバックエンドがクライアントから遠く離れている場合、クライアントリクエストの平均レイテンシが高くなる可能性があります。より低いレイテンシでクライアントにサービスを提供していた可能性のあるバックエンドが他にあっても、この状況が発生します。
特定のロードバランシングアルゴリズム（WATERFALL_BY_REGION、SPRAY_TO_REGION、WATERFALL_BY_ZONE）は、優先バックエンドとして構成されたバックエンドに適用されません。

優先バックエンドを設定する方法については、優先バックエンドを設定するをご覧ください。

サービスロードバランシングポリシーを構成する

サービスロードバランシングポリシーリソースでは、次のフィールドを構成できます。

ロードバランシングアルゴリズム
自動容量ドレイン
フェイルオーバーのしきい値
トラフィック分離

優先バックエンドを設定するには、優先バックエンドを設定するをご覧ください。

ポリシーを作成する

次の手順に沿って、サービスロードバランシングポリシーを作成して構成します。

コンソール

サービスロードバランシングポリシーを作成する手順は次のとおりです。

Google Cloud コンソールで、[ロードバランシング] ページに移動します。

[ロードバランシング] に移動
[サービスロードバランシングポリシーを作成] をクリックします。
サービスロードバランシングポリシーの [名前] を入力します。
自動容量ドレインを有効にするには、[異常なバックエンドからトラフィックをドレインする] を選択します。
[フェイルオーバーヘルスしきい値] に 1～99 の数値を入力します。
[トラフィック分散] で、使用するロードバランシングアルゴリズムを選択します。
[作成] をクリックします。

gcloud

サービスロードバランシングポリシーリソースを作成します。これは、YAML ファイルを使用して行うことも、gcloud パラメータを使用して直接行うこともできます。
- YAML ファイルを使用する場合。YAML ファイルにサービスロードバランシングポリシーを指定します。以下は YAML ファイルの例です。ロードバランシングアルゴリズムの構成方法、自動容量ドレインの有効化方法、カスタムのフェイルオーバーしきい値の設定方法を示しています。
```
name: projects/PROJECT_ID/locations/global/serviceLbPolicies/SERVICE_LB_POLICY_NAME
autoCapacityDrain:
    enable: True
failoverConfig:
    failoverHealthThreshold: FAILOVER_THRESHOLD_VALUE
loadBalancingAlgorithm: LOAD_BALANCING_ALGORITHM
isolationConfig:
  isolationGranularity: ISOLATION_GRANULARITY
  isolationMode: ISOLATION_MODE
```
次のように置き換えます。
- PROJECT_ID: プロジェクト ID。
- SERVICE_LB_POLICY_NAME: サービスロードバランシングポリシーの名前。
- FAILOVER_THRESHOLD_VALUE: フェイルオーバーのしきい値。1～99 の数値で指定してください。
- LOAD_BALANCING_ALGORITHM: 使用するロードバランシングアルゴリズム。SPRAY_TO_REGION、WATERFALL_BY_REGION、WATERFALL_BY_ZONE のいずれかになります。
- ISOLATION_GRANULARITY: 分離制限の粒度。リージョン間のトラフィックのオーバーフローを防ぐには、これを REGION に設定します。指定しないと、分離は行われません。
- ISOLATION_MODE: 分離の動作。有効な値は NEAREST または STRICT です。
YAML ファイルを作成後、ファイルを新しいサービスロードバランシングポリシーにインポートします。
```
gcloud network-services service-lb-policies import SERVICE_LB_POLICY_NAME \
   --source=PATH_TO_POLICY_FILE \
   --location=global
```
- YAML ファイルを使用しない場合。YAML ファイルを使用せずにサービスロードバランシングポリシー機能を構成することもできます。
ロードバランシングアルゴリズムを設定して自動ドレインを有効にするには、次のコマンドを使用します。
```
gcloud network-services service-lb-policies create SERVICE_LB_POLICY_NAME \
   --load-balancing-algorithm=LOAD_BALANCING_ALGORITHM \
   --auto-capacity-drain \
   --failover-health-threshold=FAILOVER_THRESHOLD_VALUE \
   --location=global
```
次のように置き換えます。
- SERVICE_LB_POLICY_NAME: サービスロードバランシングポリシーの名前。
- LOAD_BALANCING_ALGORITHM: 使用するロードバランシングアルゴリズム。SPRAY_TO_REGION、WATERFALL_BY_REGION、WATERFALL_BY_ZONE のいずれかになります。
- FAILOVER_THRESHOLD_VALUE: フェイルオーバーのしきい値。1～99 の数値で指定してください。
トラフィック分離（プレビュー）を構成するには、次のコマンドを使用します。
```
gcloud beta network-services service-lb-policies create SERVICE_LB_POLICY_NAME \
   --isolation-config-granularity=ISOLATION_GRANULARITY \
   --isolation-config-mode=ISOLATION_MODE \
   --location=global
```
次のように置き換えます。
- ISOLATION_GRANULARITY: 分離制限の粒度。リージョン間のトラフィックのオーバーフローを防ぐには、これを REGION に設定します。指定しないと、分離は行われません。
- ISOLATION_MODE: 分離の動作。有効な値は NEAREST または STRICT です。
バックエンドサービスを更新して、--service-lb-policy フィールドが新しく作成したサービスロードバランシングポリシーリソースを参照するようにします。バックエンドサービスは、1 つのサービスロードバランシングポリシーリソースにのみ関連付けられます。
```
gcloud compute backend-services update BACKEND_SERVICE_NAME \
 --service-lb-policy=SERVICE_LB_POLICY_NAME \
 --global
```
バックエンドサービスを作成する際に、サービスロードバランシングポリシーをバックエンドサービスに関連付けることもできます。
```
gcloud compute backend-services create BACKEND_SERVICE_NAME \
 --protocol=PROTOCOL \
 --port-name=NAMED_PORT_NAME \
 --health-checks=HEALTH_CHECK_NAME \
 --load-balancing-scheme=LOAD_BALANCING_SCHEME \
 --service-lb-policy=SERVICE_LB_POLICY_NAME \
 --global
```

ポリシーで構成した機能を無効にする

このセクションでは、サービスロードバランシングポリシーで構成した機能をリセットまたは無効にする方法について説明します。

ロードバランシングアルゴリズムをリセットする

ロードバランシングアルゴリズムをリセットするには、次のコマンドを使用して、ロードバランシングアルゴリズムをデフォルトの WATERFALL_BY_REGION に戻します。

gcloud network-services service-lb-policies update SERVICE_LB_POLICY_NAME \
    --load-balancing-algorithm=WATERFALL_BY_REGION \
    --location=global

フェイルオーバーのしきい値をリセットする

フェイルオーバーのしきい値をリセットするには、次のコマンドを使用して、フェイルオーバーのしきい値をデフォルトの 70 秒に戻します。

gcloud network-services service-lb-policies update SERVICE_LB_POLICY_NAME \
    --failover-health-threshold=70 \
    --location=global

自動容量ドレインを無効にする

自動容量ドレインを無効にするには、次のコマンドを使用します。

gcloud network-services service-lb-policies update SERVICE_LB_POLICY_NAME \
    --no-auto-capacity-drain \
    --location=global

トラフィック分離を無効にする

トラフィック分離（プレビュー）を無効にするには、以下のコマンドのとおり、両方の分離構成パラメータを UNSPECIFIED に設定します。

gcloud beta network-services service-lb-policies update SERVICE_LB_POLICY_NAME \
    --isolation-config-granularity=UNSPECIFIED \
    --isolation-config-mode=UNSPECIFIED \
    --location=global

ポリシーを削除する

バックエンドサービスからサービスロードバランシングポリシーを削除するには、次のコマンドを使用します。

gcloud compute backend-services update BACKEND_SERVICE_NAME \
    --no-service-lb-policy \
    --global

優先バックエンドを設定する

優先バックエンドを構成するには、Google Cloud CLI または API を使用します。

コンソール

Google Cloud コンソールでグローバルロードバランサまたはクロスリージョンロードバランサを作成するときに、特定のバックエンドを優先バックエンドとして指定できます。

バックエンドサービスにバックエンドを追加するときに、[バックエンド優先レベル] フィールドを [優先] に設定します。

gcloud

優先バックエンドを追加する

優先バックエンドを設定するには、バックエンドサービスにバックエンドを追加するときに、gcloud compute backend-services add-backend コマンドを使用して --preference フラグを設定します。

gcloud compute backend-services add-backend BACKEND_SERVICE_NAME \
    ...
    --preference=PREFERENCE \
    --global

PREFERENCE は、バックエンドに割り当てる優先レベルに置き換えます。PREFERRED または DEFAULT になります。

コマンドの残りの部分は、使用しているバックエンドのタイプ（インスタンスグループまたは NEG）によって異なります。必須パラメータについては、gcloud compute backend-services add-backend コマンドをご覧ください。

バックエンドの優先設定を更新する

バックエンドの --preference パラメータを更新するには、gcloud compute backend-services update-backend コマンドを使用します。

gcloud compute backend-services update-backend BACKEND_SERVICE_NAME \
    ...
    --preference=PREFERENCE \
    --global

コマンドの残りの部分は、使用しているバックエンドのタイプ（インスタンスグループまたは NEG）によって異なります。次のコマンドの例では、バックエンドインスタンスグループの優先設定を更新し、PREFERRED に設定しています。

gcloud compute backend-services update-backend BACKEND_SERVICE_NAME \
    --instance-group=INSTANCE_GROUP_NAME \
    --instance-group-zone=INSTANCE_GROUP_ZONE \
    --preference=PREFERRED \
    --global

API

優先バックエンドを設定するには、グローバル backendServices リソースを使用して、各バックエンドに preference フラグを設定します。

以下の例では、バックエンドの優先設定を構成しています。

  name: projects/PROJECT_ID/locations/global/backendServices/BACKEND_SERVICE_NAME
  ...
  - backends
      name: BACKEND_1_NAME
      preference: PREFERRED
      ...
  - backends
      name: BACKEND_2_NAME
      preference: DEFAULT
      ...

次のように置き換えます。

PROJECT_ID: プロジェクト ID
BACKEND_SERVICE_NAME: バックエンドサービスの名前
BACKEND_1_NAME: 優先バックエンドの名前
BACKEND_2_NAME: デフォルトのバックエンドの名前

トラブルシューティング

新しいサービスロードバランシングポリシーをバックエンドサービスに接続すると、トラフィック分散パターンが変わる可能性があります。

トラフィックの問題をデバッグするには、Cloud Monitoring を使用して、ロードバランサとバックエンドの間のトラフィックフローを確認します。Cloud Load Balancing のログと指標は、ロードバランシングの動作を把握するうえでも役立ちます。

このセクションでは、このような機能をオンにしたときに発生する可能性のある、一般的なシナリオをいくつか説明します。

ロードバランシングアルゴリズム

1 つの送信元からのトラフィックが非常に数多くのバックエンドに送信されている

SPRAY_TO_REGION アルゴリズムの場合、これは想定内の動作です。ただし、トラフィックをより広い範囲に分散すると、問題が発生する可能性があります。たとえば、バックエンドはさまざまなクライアントからのトラフィックを認識するため、キャッシュヒット率が低下する可能性があります。この場合は、WATERFALL_BY_REGION などの他のアルゴリズムの使用を検討してください。

自動容量ドレイン

異常なエンドポイントが多いバックエンドにトラフィックが送信されていない

autoCapacityDrain が有効になっている場合、これは想定内の動作です。正常でないエンドポイントの数が多いバックエンドはドレインされ、ロードバランシングプールから削除されます。この動作が望ましくない場合は、自動容量ドレインを無効にできます。ただし、異常なエンドポイントが多いバックエンドにトラフィックが送信され、リクエストが失敗する可能性があります。

フェイルオーバーのしきい値

一時的に健全性が変化したときにトラフィックがリモートバックエンドに送信される

これは、フェイルオーバーのしきい値が大きな値に設定されている場合の動作です。一時的な健全性の変化が発生したときにトラフィックをプライマリバックエンドに送信し続ける場合は、このフィールドに小さい値を設定します。

他のエンドポイントが異常な場合、正常なエンドポイントが過負荷になる

これは、フェイルオーバーのしきい値が低い値に設定されている場合の動作です。エンドポイントが異常な場合、これらの異常なエンドポイント宛てのトラフィックは同じバックエンドの残りのエンドポイントに分散されます。フェイルオーバーの動作をより速やかにトリガーする場合は、このフィールドにより大きな値を設定します。

優先バックエンド

トラフィックが近くのバックエンドではなく、遠く離れたバックエンドに送信されている

優先バックエンドがデフォルトのバックエンドよりも遠くにある場合、これは想定内の動作です。この動作が望ましくない場合は、それに応じて各バックエンドの優先設定を更新します。

優先バックエンドを使用している場合に、一部のバックエンドにトラフィックが送信されない

優先バックエンドがまだ容量に達していない場合、これは想定内の動作です。優先バックエンドは、これらのバックエンドへのラウンドトリップ時間のレイテンシに基づいて割り当てられます。

トラフィックを他のバックエンドに送信する場合は、次のいずれかを行います。

他のバックエンドの優先設定を更新します。
優先バックエンドのターゲット容量を低く設定します。ターゲット容量は、バックエンドサービスのバランシングモードによって max-rate フィールドまたは max-utilization フィールドを使用して構成できます。

トラフィック分離

クロスリージョン内部ロードバランサに送信されたリクエストが失敗する

STRICT 分離モードが有効になっており、ロードバランサと同じリージョンにバックエンドが構成されていない場合、トラフィックは失敗します。これが意図した動作でない場合は、トラフィックが送信されるリージョンにバックエンドを構成するようにします。または、分離モードを NEAREST に設定して、トラフィックを次に近いリージョンにルーティングする方法もあります。

トラフィックがリモートリージョンから近いリージョンにルーティングされる

リクエストの分離は容量ベースのトラフィックオーバーフローを防止します。そのため、この機能を有効にする前にバックエンドがすでに過負荷になっていた場合、トラフィックはすでにリモートリージョンに送信されていた可能性があります。このような場合にこの機能をオンにすると、このトラフィックが最も近いリージョンに再度ルーティングされることがあります。

トラフィック分離を有効にした後、トラフィックが再度ルーティングされなかった

リクエストの分離は容量ベースのトラフィックオーバーフローを防止します。そのため、この機能を有効にする前に最も近くのリージョンのバックエンドが過負荷になっていなかった場合、最も近くのリージョンがすべてのトラフィックを処理できる可能性は高いです。その場合、短期的にはトラフィックのルーティングは変更されないと想定されます。これはトラフィック量の変化に伴い変わる可能性があります。

リージョンにバックエンドを追加または削除するとトラフィックが移動する

ロードバランサがトラフィックをルーティングしてネットワークの全体的なレイテンシを最適化しようとすることによる、想定内の動作です。新しいバックエンドが近くのリージョンにデプロイされると、ロードバランサはそのリージョンにより多くのトラフィックを送信する可能性があります。同様に、バックエンドが削除されると、リクエストの分離設定に応じて、ロードバランサはオーバーフロートラフィックを遠く離れたリージョンに送信するようになります。

制限事項

各バックエンドサービスは、1 つのサービスロードバランシングポリシーリソースにのみ関連付けることができます。

高度なロード バランシング最適化 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

始める前に

サポートされているロードバランサとバックエンド

ロード バランシング アルゴリズム

リージョンごとのウォーターフォール

リージョンへのスプレー

ゾーンごとのウォーターフォール

ロード バランシング アルゴリズムを比較する

自動容量ドレインと自動容量ドレイン解除

自動容量ドレイン

自動容量ドレイン解除

フェイルオーバーのしきい値

トラフィック分離

分離なし

Nearest

Strict

優先バックエンド

サービス ロード バランシング ポリシーを構成する

ポリシーを作成する

コンソール

gcloud

ポリシーで構成した機能を無効にする

ロード バランシング アルゴリズムをリセットする

フェイルオーバーのしきい値をリセットする

自動容量ドレインを無効にする

トラフィック分離を無効にする

ポリシーを削除する

優先バックエンドを設定する

コンソール

gcloud

優先バックエンドを追加する

バックエンドの優先設定を更新する

API

トラブルシューティング

ロード バランシング アルゴリズム

自動容量ドレイン

フェイルオーバーのしきい値

優先バックエンド

トラフィック分離

制限事項

高度なロードバランシング最適化

ロードバランシングアルゴリズム

ロードバランシングアルゴリズムを比較する

サービスロードバランシングポリシーを構成する

ロードバランシングアルゴリズムをリセットする

ロードバランシングアルゴリズム