コンテンツに移動
Containers & Kubernetes

リージョン GKE クラスタとゾーン GKE クラスタ: ワークロードに応じた適切な選択肢

2024年3月22日
Google Cloud Japan Team

※この投稿は米国時間 2024 年 3 月 5 日に、Google Cloud blog に投稿されたものの抄訳です。

Google Kubernetes EngineGKE)を使用すると、企業は Google Cloud 内でコンテナ化アプリケーションを効率的にオーケストレーション、管理、スケールできます。GKE 環境を設計する際は、リージョン クラスタとゾーンクラスタのどちらを選択するかが重要な決定事項となります。この選択が、アプリケーションの可用性、スケーラビリティ、費用対効果に大きく影響します。このブログ投稿では、各クラスタタイプの特徴とその考慮事項について詳細に説明し、どちらを選択するかを決める際に役立つ情報を提供します。

基礎知識

リージョン クラスタとゾーンクラスタの主な違いは、コントロール プレーンとノードの分散方法にあります。

ゾーンクラスタでは、コントロール プレーン(クラスタ オペレーションを統括)とワーカーノード(ワークロードを実行)がリージョン内の 1 つのゾーンでホストされます。

リージョン クラスタでは、リージョン内の複数のゾーンにコントロール プレーンが複製されるため、優れた復元力を持ちます。また、ワーカーノードを複数のゾーンに分散させてフォールト トレランスを強化したり、1 つのゾーンに制限してゾーン間のネットワーク費用を節約したりすることが可能です。

適切なクラスタタイプを選択することは、GKE での成功に非常に重要です。それでは、意思決定プロセスに役立つ、以下の主な概念について説明します。

意思決定における主な考慮事項

高可用性の要件

リージョン GKE クラスタまたはゾーン GKE クラスタのどちらを選択するかを決定する際、高可用性がおそらく最も重要な要件となるでしょう。

ゾーンクラスタのほうが、サービスの停止に対する脆弱性が高くなります。クラスタが存在するゾーンで障害が発生した場合、コントロール プレーンとワーカーノードの両方が停止し、アプリケーションのダウンタイムを招く可能性があります。

リージョン クラスタは稼働時間が最大になるように設計されており、コントロール プレーンは複数のゾーンに分散されています。1 つのゾーンが利用できなくなっても、コントロール プレーンは他のゾーンで稼働を継続し、サービスの停止は最小限に抑えられます。

高可用性は、多くの場合ミッション クリティカルです。ダウンタイムが許容されない本番環境ワークロードには、リージョン クラスタをおすすめします。

スケーラビリティのニーズ

スケーリングの要件に関しては、通常、リージョン クラスタのほうが優れています。ゾーンクラスタにもスケーリング能力はありますが、特にトラフィックが急増した場合に、単一のゾーン内のリソース上限に達する可能性があります。

リージョン クラスタでは、複数のゾーンのリソースプールにより、大規模なワークロードや予測不可能なスケーリングの需要に対応できる能力が高くなります。基本的には、大規模なワークロードや大きな需要の変動が予想される場合は、リージョン クラスタのほうが柔軟性が高く、よりスムーズにスケールできます。

費用に関する考慮事項

どちらのクラスタタイプも料金構成は同様で、同じクラスタ管理手数料が適用されます。ゾーンクラスタには GKE 無料枠があり、最初の GKE ゾーン(Autopilot)クラスタの管理手数料をまかなうのに十分な毎月のクレジットが提供されます。リージョン クラスタでは、リソースが複製され、クロスゾーンのネットワーク トラフィックが発生する可能性があるため、ゾーンクラスタよりも費用がわずかに増加します。

結論としては、リージョン クラスタのほうが費用は高くなりますが、可用性とスケーラビリティに優れています。ゾーンクラスタは、特定のユースケースで費用を抑えることができます。予算と潜在的なダウンタイムの許容度を慎重に評価し、リージョン クラスタの費用の増加が理にかなったものであるかを検討してください。

更新とメンテナンス

更新とメンテナンスに関する考慮事項は、ゾーンクラスタとリージョン クラスタのどちらを選択するかに大きく影響します。ゾーンクラスタは、更新とメンテナンスは比較的単純ですが、クラスタが 1 つのゾーンリソースに依存することになるため、適切に処理しないと、長時間のダウンタイムの影響を受けます。一方、リージョン クラスタは、そのような状況に対する復元力に優れています。リソースは複数のゾーンに分散されているため、更新の実装やメンテナンス タスクを、ワークロードの停止を最小限に抑えて実施できます。リージョン クラスタでは、コントロール プレーンが複数のゾーンで複製されるため、1 つのゾーンでメンテナンス処理が進行中でも、アプリケーションのパフォーマンスに中断は発生しません。ただし、リソースを広範囲に分散させることで、調整が複雑になり、ゾーン間でバージョンや構成が一致しなくなる可能性があるため、注意深いプランニングと管理が重要となります。

意思決定

意思決定の際に参照しやすいよう、以下の表に上記の要点をまとめました。

特性

ゾーンクラスタ

リージョン クラスタ

可用性

ゾーンで障害が発生したときに、ダウンタイムの影響を受けやすい。

コントロール プレーンとノードが複数のゾーンに分散されているため、可用性が高い。ゾーンの障害が発生した場合の復元力が高い。

スケーラビリティ

1 つのゾーン内で利用可能なリソースによって制限される可能性がある。

より大規模で動的なワークロードにもより簡単に対応可能。

費用

小規模または重要度の低いワークロードでより費用対効果が高い選択肢。GKE 無料枠のクレジットを利用可能。

リソースが複製されるため費用がわずかに増加。

更新とメンテナンス

更新 / メンテナンス中にダウンタイムの影響を受けやすい。

更新 / メンテナンス中のワークロードの停止は最小限。

一般的なユースケース

以下に、ゾーンクラスタとリージョン クラスタの一般的なユースケースを示します。

ゾーンクラスタ:

  • 高可用性が最優先事項でない開発 / テスト環境

  • トラフィックの少ない、またはクリティカルでないアプリケーション

  • ユーザーやダウンストリームが 1 つの地理的エリアに集中しているアプリケーション

リージョン クラスタ:

  • 最大の稼働時間を必要とする本番環境グレードのミッション クリティカルなアプリケーション

  • 動的なスケーリング ニーズを持つ大規模なアプリケーション

  • さまざまな地域に分散するユーザーベースにサービスを提供するアプリケーション

まとめ

リージョン GKE クラスタとゾーン GKE クラスタの主なトレードオフは、可用性と費用のバランスを取ることです。ゾーンクラスタは、小規模または重要度の低いワークロードで費用対効果が高い選択肢です。リージョン クラスタは、最大限の可用性と復元力が優先されているため、ミッション クリティカルなアプリケーションや大規模なデプロイに理想的です。

最適な構成は、ご使用のアーキテクチャ、稼働時間要件、予算によって異なります。これらのトレードオフを慎重に検討し、GKE Deployment がアプリケーションのニーズにシームレスに対応できるようにすることをおすすめします。

詳しい情報については、Google Cloud の公式ドキュメントでより詳細なガイダンスをご確認ください。

-GKE プロダクト マネージャー Artemi Ollin

投稿先