ロードバランシングとスケーリング

Google Cloud では、インスタンスのグループを対象としたロードバランシングと自動スケーリングを行うことができます。

ロードバランシング

Google Cloud では、サーバー側でロードバランシングが行われるため、受信したトラフィックを複数の仮想マシン（VM）インスタンスに分散できます。負荷分散には、次の利点があります。

アプリケーションのスケーリング
重い負荷への対応
ヘルスチェックによる正常でない VM インスタンスの検出と自動的な除外（正常な状態に復帰したインスタンスは自動的に元どおりに追加されます）
最も近い位置にある仮想マシンへのトラフィックの振り分け

Google Cloud の負荷分散では、転送ルールリソースを使用して特定の種類のトラフィックを照合し、ロードバランサに転送します。たとえば、転送ルールによって IP アドレス 192.0.2.1 のポート 80 宛ての TCP トラフィックを照合し、それをロードバランサに転送してから、健全性の高い VM インスタンスに送信できます。

Google Cloud Load Balancing はマネージドサービスです。そのためコンポーネントに冗長性があり、高い可用性を実現しています。ロードバランシングのコンポーネントに障害が発生すると、そのコンポーネントは直ちに自動的に再起動または交換されます。

Google Cloud では、容量、用途、構成方法が異なる複数のロードバランシングを行うことができます。詳細については、Google Cloud の負荷分散のドキュメントをご覧ください。

自動スケーリング

Compute Engine は自動スケーリング機能を備えています。この機能では、負荷の増減に基づき、マネージドインスタンスグループ（MIG）に対して自動的に VM インスタンスの追加と削除が行われます。自動スケーリングによってトラフィックの増加をアプリケーションで適切に処理できるようになり、リソースの必要性が低下した場合には費用を抑えることができます。CPU 使用率、Cloud Monitoring の指標、スケジュール、またはロードバランシングの処理能力に基づいて MIG を自動スケーリングできます。

ロードバランシングの処理能力に基づいてスケーリングを行うようオートスケーラーを設定すると、オートスケーラーによってインスタンスグループの処理能力がモニタリングされ、VM の処理能力の過不足に応じてスケーリングが行われます。インスタンスの処理能力は、使用率または 1 秒あたりのリクエスト数に基づいて、ロードバランサのバックエンドサービスで定義できます。詳しくは、ロードバランシング処理能力に基づくスケーリングをご覧ください。

自動スケーリングの詳細については、インスタンスのグループの自動スケーリングをご覧ください。

次のステップ

インスタンスグループの詳細を確認する。
以下に基づいて、マネージドインスタンスグループを自動スケーリングする方法を学習する。
ロードバランサの選択方法と次の方法について学習する
- 外部アプリケーションロードバランサを設定する方法
- 外部パススルーネットワークロードバランサを設定する方法

ロード バランシングとスケーリング