このページは Cloud Translation API によって翻訳されました。

ロードバランシング処理能力に基づくスケーリング

このドキュメントでは、外部アプリケーションロードバランサまたは内部アプリケーションロードバランサの処理能力に基づいてマネージドインスタンスグループ（MIG）をスケールする方法について説明します。この方法では、グループが最大能力のうちの一定の割合（この値は構成可能）に達したことをロードバランサが示したときに、自動スケーリングによって VM インスタンスがグループに追加または削除されます。最大能力は、バックエンドインスタンスグループの、選択されている分散モードのターゲット容量によって定義されます。

また、CPU 使用率またはモニタリング指標に基づいて MIG をスケーリングすることもできます。

制限事項

外部アプリケーションロードバランサと内部アプリケーションロードバランサの処理能力に基づいて、マネージドインスタンスグループを自動スケーリングできます。他のタイプのロードバランサはサポートされていません。

始める前に

オートスケーラーの制限事項を確認します。
オートスケーラーの基礎知識を確認します。
まだ設定していない場合は、認証を設定します。認証では、 Google Cloud サービスと API にアクセスするための ID が確認されます。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine に対する認証を行います。
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Google Cloud CLI をインストールします。インストール後、次のコマンドを実行して Google Cloud CLI を初期化します。
  gcloud init
  外部 ID プロバイダ（IdP）を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。
  
  注: すでに gcloud CLI をインストールしている場合は、gcloud components update を実行して、最新バージョンがインストールされていることを確認してください。
2. Set a default region and zone.
REST

このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。

HTTP(S) ロードバランシング処理能力に基づくスケーリング

Compute Engine ではインスタンスグループ内でのロードバランシングのサポートが提供されています。インスタンスの負荷に基づいてスケーリングするオートスケーラーをセットアップすることによって、自動スケーリングを負荷分散と組み合わせて使用できます。

外部または内部の HTTP（S）ロードバランサは、URL マップに従ってバックエンドサービスにリクエストを分散します。ロードバランサには 1 つまたは複数のバックエンドサービスを接続できます。それぞれのバックエンドサービスが、インスタンスグループまたはネットワークエンドポイントグループ（NEG）バックエンドをサポートします。バックエンドがインスタンスグループである場合、HTTP（S）ロードバランサでは UTILIZATION と RATE の 2 つの分散モードを使用できます。UTILIZATION では、インスタンスグループ内のインスタンスの平均バックエンド使用率の最大ターゲットを指定できます。RATE では、インスタンス単位またはグループ単位での 1 秒あたりのリクエスト数のターゲット数を指定する必要があります（グループ全体の最大レートを指定できるのは、ゾーンインスタンスグループのみです。リージョンマネージドインスタンスグループでは、グループ単位の最大レートを定義できません）。

分散モードとターゲット容量を指定することで、バックエンド VM が最大容量に達したと Google Cloud が判断する条件を定義します。 Google Cloud は、容量が残っている正常な VM にトラフィックを送信しようとします。すべての VM がすでに容量に達すると、ターゲット使用率またはレートの超過が発生します。

HTTP（S）ロードバランサのインスタンスグループバックエンドにオートスケーラーを接続すると、オートスケーラーはマネージドインスタンスグループをスケーリングしてロードバランスの処理能力の割合を維持します。

たとえば、マネージドインスタンスグループの負荷分散処理能力が、インスタンスあたり 100 RPS であると仮定します。HTTP(S) ロードバランシングポリシーを使用するオートスケーラーを作成し、0.8 つまり 80% のターゲット使用率レベルを維持するように設定している場合、オートスケーラーは、マネージドインスタンスグループからインスタンスを追加または削除して、80% の処理能力つまりインスタンスあたり 80 RPS を維持します。

次の図は、オートスケーラーとマネージドインスタンスグループおよびバックエンドサービスとのやり取りを示しています。

オートスケーラー、マネージドインスタンスグループ、負荷分散バックエンドサービスの間の関係 — オートスケーラーは、バックエンドサービスで定義されている、マネージドインスタンスグループの処理能力を監視し、ターゲット使用率に基づいてスケーリングします。この例では、処理能力は `maxRatePerInstance` の値で測定されています。

適用可能な負荷分散構成

負荷分散処理能力は 3 つのうちのいずれかを設定できます。バックエンドを最初に作成する際に、最大バックエンド使用率、インスタンスごとの 1 秒あたりの最大リクエスト数、グループ全体での 1 秒あたりの最大リクエスト数から選択できます。最大バックエンド使用率と秒 / インスタンスあたりの最大リクエスト数の値は、インスタンスの追加または削除によって制御できるため、オートスケーラーではこれらの設定のみを使用できます。たとえば、あるバックエンドがインスタンスにつき毎秒 10 個のリクエストを処理するように設定し、その能力の 80% を維持するようにオートスケーラーを構成している場合、インスタンス / 秒あたりのリクエスト数が変化するとオートスケーラーはインスタンスを追加または削除できます。

グループあたりの最大リクエスト数の設定はインスタンスグループ内のインスタンス数とは無関係であるため、オートスケーラーではこの設定を使用できません。ロードバランサは、グループ内のインスタンス数に関係なく、グループあたりの最大数のリクエストをそのインスタンスグループに送信し続けます。

たとえば、グループあたり 1 秒あたりの最大 100 個のリクエスト数を処理するようにバックエンドを設定している場合、そのグループのインスタンス数が 2 であっても 100 であっても、ロードバランサはそのグループに 1 秒あたり 100 個のリクエストを送信します。この値は調整できないため、自動スケーリングでは、グループごとに 1 秒あたりの最大リクエスト数を使用するロードバランシング構成を使用できません。

負荷分散処理能力に基づく自動スケーリングの有効化

このタスクに必要な権限

このタスクを行うには、次の権限が必要です。

プロジェクトに対する compute.autoscalers.create
プロジェクトに対する compute.instanceGroupManagers.use

コンソール

Google Cloud コンソールの [インスタンスグループ] ページに移動します。
[インスタンスグループ] に移動
インスタンスグループがある場合は、それを選択して [編集] をクリックします。インスタンスグループがない場合は、[インスタンスグループを作成] をクリックします。
[グループサイズと自動スケーリング] をクリックして、セクションを開きます。
[自動スケーリングモード] リストで、[オン: グループに対してインスタンスを追加および削除します] が選択されていることを確認します。
このグループでオートスケーラーが作成するインスタンスの数の最小値と最大値を指定します。
[自動スケーリングシグナル] セクションで、[シグナルを追加] をクリックします。
[シグナルタイプ] を [HTTP ロードバランシングの使用率] に設定します。
[HTTP ロードバランシング使用率の目標値] にパーセンテージで値を入力します。たとえば、HTTP 負荷分散使用率 60% を指定するには「60」と入力します。
初期化期間フィールドを使用して初期化期間を設定できます。これにより、アプリケーションの初期化に要する時間をオートスケーラーに指示できます。正確な初期化期間を指定することで、オートスケーラーによる判断が向上します。たとえば、スケールアウト時、オートスケーラーは初期化中の VM のデータを無視します。初期化中の VM はアプリケーションの通常の使用状況を表していない可能性があるためです。デフォルトの初期化期間は 60 秒です。
変更を保存します。

gcloud

処理能力に基づいてスケーリングするオートスケーラーを有効にするには、set-autoscaling サブコマンドを使用します。たとえば次のコマンドでは、対象のマネージドインスタンスグループが処理能力の 60% を維持するようにスケーリングするオートスケーラーが作成されます。オートスケーラーを作成する場合は、--target-load-balancing-utilization パラメータだけではなく、--max-num-replicas パラメータも必要です。

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-load-balancing-utilization 0.6 \
    --cool-down-period 90

--cool-down-period フラグを使用して初期化期間を設定できます。これにより、アプリケーションの初期化に要する時間をオートスケーラーに指定できます。正確な初期化期間を指定することで、オートスケーラーによる判断が向上します。たとえば、スケールアウト時、オートスケーラーは初期化中の VM のデータを無視します。初期化中の VM はアプリケーションの通常の使用状況を表していない可能性があるためです。デフォルトの初期化期間は 60 秒です。

instance-groups managed describe サブコマンドを使用して、オートスケーラーが正常に作成されたことを確認できます。

gcloud compute instance-groups managed describe example-managed-instance-group

利用可能な gcloud コマンドとフラグの一覧については、gcloud リファレンスをご覧ください。

REST

オートスケーラーを作成するには、autoscalers.insert メソッド（ゾーン MIG の場合）または regionAutoscalers.insert メソッド（リージョン MIG の場合）を使用します。

次の例では、ゾーン MIG にオートスケーラーを作成します。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/

リクエスト本文には name フィールド、target フィールド、autoscalingPolicy フィールドを含める必要があります。autoscalingPolicy で loadBalancingUtilization を定義する必要があります。

coolDownPeriodSec フィールドを使用して初期化期間を設定できます。これにより、アプリケーションの初期化に要する時間をオートスケーラーに指示できます。正確な初期化期間を指定することで、オートスケーラーによる判断が向上します。たとえば、スケールアウト時、オートスケーラーは初期化中の VM のデータを無視します。初期化中の VM はアプリケーションの通常の使用状況を表していない可能性があるためです。デフォルトの初期化期間は 60 秒です。

{

 "name": "example-autoscaler",
 "target": "zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
 "autoscalingPolicy": {
    "maxNumReplicas": 20,
    "loadBalancingUtilization": {
       "utilizationTarget": 0.8
     },
    "coolDownPeriodSec": 90
  }
}

ロードバランシングの処理能力に基づく自動スケーリングの有効化の詳細については、チュートリアルの Compute Engine でウェブサービスのグローバルな自動スケーリングを行うを完了してください。

次のステップ

オートスケーラーの管理について学習する。
オートスケーラーによる決定の仕組みについて確認する。
複数の自動スケーリング信号を使用してグループをスケールする方法を確認する。

ロード バランシング処理能力に基づくスケーリング

制限事項

始める前に

Console

gcloud

REST

HTTP(S) ロード バランシング処理能力に基づくスケーリング

適用可能な負荷分散構成

負荷分散処理能力に基づく自動スケーリングの有効化

このタスクに必要な権限

コンソール

gcloud

REST

次のステップ

ロードバランシング処理能力に基づくスケーリング

HTTP(S) ロードバランシング処理能力に基づくスケーリング