Google Cloud では、インスタンスのグループを対象としたロード バランシングと自動スケーリングを行うことができます。
ロード バランシング
Google Cloud では、サーバー側でロード バランシングが行われるため、受信したトラフィックを複数の仮想マシン(VM)インスタンスに分散できます。負荷分散には、次の利点があります。
- アプリケーションのスケーリング
- 重い負荷への対応
- ヘルスチェックによる正常でない VM インスタンスの検出と自動的な除外(正常な状態に復帰したインスタンスは自動的に元どおりに追加されます)
- 最も近い位置にある仮想マシンへのトラフィックの振り分け
Google Cloud の負荷分散では、転送ルールリソースを使用して特定の種類のトラフィックを照合し、ロードバランサに転送します。たとえば、転送ルールによって IP アドレス 192.0.2.1
のポート 80 宛ての TCP トラフィックを照合し、それをロードバランサに転送してから、健全性の高い VM インスタンスに送信できます。
Google Cloud Load Balancing はマネージド サービスです。そのためコンポーネントに冗長性があり、高い可用性を実現しています。ロード バランシングのコンポーネントに障害が発生すると、そのコンポーネントは直ちに自動的に再起動または交換されます。
Google Cloud では、容量、用途、構成方法が異なる複数のロード バランシングを行うことができます。詳細については、Google Cloud の負荷分散のドキュメントをご覧ください。
自動スケーリング
Compute Engine は自動スケーリング機能を備えています。この機能では、負荷の増減に基づき、マネージド インスタンス グループ(MIG)に対して自動的に VM インスタンスの追加と削除が行われます。自動スケーリングによってトラフィックの増加をアプリケーションで適切に処理できるようになり、リソースの必要性が低下した場合には費用を抑えることができます。CPU 使用率、Cloud Monitoring の指標、スケジュール、またはロード バランシングの処理能力に基づいて MIG を自動スケーリングできます。
ロード バランシングの処理能力に基づいてスケーリングを行うようオートスケーラーを設定すると、オートスケーラーによってインスタンス グループの処理能力がモニタリングされ、VM の処理能力の過不足に応じてスケーリングが行われます。インスタンスの処理能力は、使用率または 1 秒あたりのリクエスト数に基づいて、ロードバランサのバックエンド サービスで定義できます。詳しくは、ロード バランシング処理能力に基づくスケーリングをご覧ください。
自動スケーリングの詳細については、インスタンスのグループの自動スケーリングをご覧ください。
次のステップ
- インスタンス グループの詳細を確認する。
- 以下に基づいて、マネージド インスタンス グループを自動スケーリングする方法を学習する。
- ロードバランサの選択方法と次の方法について学習する