リージョンクラスタ

Autopilot Standard

このページでは、Google Kubernetes Engine（GKE）内のリージョンクラスタの動作について説明します。

リージョンクラスタでは、リージョン内の複数のゾーンにコントロールプレーンが複製されるため、クラスタの可用性が向上します。

この構成には次の利点があります。

単一ゾーンの障害からの復元力: リージョンクラスタは、リージョン内の単一のゾーンだけでなく、リージョン全体で使用できます。1 つのゾーンが使用できなくなっても、コントロールプレーンには影響がありません。
継続的コントロールプレーンアップグレード、コントロールプレーンリサイズ、およびコントロールプレーン障害時のダウンタイムの短縮。コントロールプレーンの冗長レプリカにより、リージョンクラスタは Kubernetes API の可用性を高め、アップグレード中でもコントロールプレーンにアクセスできます。

また、デフォルトでは、リージョンクラスタはマルチゾーンクラスタとして作成されるため、ワーカーノードはリージョン内の複数のゾーンに分散されます。十分な数のレプリカを実行すると、ワークロードの可用性が向上します。

GKE Autopilot クラスタは常にリージョンクラスタです。GKE Standard を使用する場合は、リージョンクラスタまたはゾーンクラスタを作成できます。クラスタの可用性のタイプについては、クラスタの可用性をご覧ください。

Autopilot クラスタを含むリージョンクラスタでは、コントロールプレーンは 1 つのリージョンの複数のゾーンに複製されます。GKE は、同じリージョン内のゾーンにノードを自動的に複製します。Standard クラスタとノードプールでは、必要に応じてノードが実行されるゾーンを手動で指定できます。すべてのゾーンは、コントロールプレーンと同じリージョン内に存在する必要があります。

リージョンクラスタを作成した後は、そのクラスタをゾーンクラスタに変更することはできません

リージョンクラスタの仕組み

リージョンクラスタは、クラスタのコントロールプレーンとノードを単一リージョン内の複数のゾーンにわたって複製します。たとえば、us-east1 リージョン内のリージョンクラスタは、デフォルトの構成を使用して、異なる us-east1 ゾーンにコントロールプレーンの複数のレプリカを作成し、3 つの us-east1 ゾーン（us-east1-b、us-east1-c、us-east1-d）にノードをプロビジョニングします。インフラストラクチャが停止しても、Autopilot ワークロードは引き続き実行され、GKE は自動的にノードを再調整します。Standard クラスタを使用する場合は、手動で、またはクラスタオートスケーラーを使用して、ノードを再調整する必要があります。

制限事項

リージョン Standard クラスタ用に作成されるデフォルトのノードプールは、リージョン内の 3 つのゾーンに均等に分散した 9 つのノード（ゾーンごとに 3 つ）で構成されています。これにより、パブリックノードを使用するクラスタで 9 個の IP アドレスが使用されます。必要に応じて、ノードの数をゾーンあたり 1 つに減らすことができます。新規に作成された Cloud 請求先アカウントには、リージョンごとに 8 つの IP アドレスしか付与されないため、リージョンクラスタの規模に応じて、使用中のリージョン IP アドレスの割り当ての増加をリクエストする必要があります。使用可能な IP アドレスが少なすぎると、クラスタの作成が失敗します。
リージョンクラスタで GPU を実行するには、リクエストされた GPU が利用可能なゾーンが 1 つ以上あるリージョンを選択します。ノードプールを作成するときに、--node-locations フラグを使用して、リクエストされた GPU を含むゾーン（複数可）を指定する必要があります。

選択したリージョンに、リクエストした GPU を使用できるゾーンが 1 つもない場合、次のようなエラーが表示されることがあります。
```
ERROR: (gcloud.container.clusters.create) ResponseError: code=400, message=
    Accelerator type "nvidia-l4" does not exist in zone europe-west3-a.
```
GPU を利用できるリージョンとゾーンの一覧については、Compute Engine の GPU をご覧ください。
標準モードのノードプールのゾーンは、クラスタのコントロールプレーンと同じリージョンに存在する必要があります。必要に応じて、クラスタのゾーンを変更できます。変更すると、新規ノードと既存ノードのすべてがそれらのゾーンにまたがることになります。

料金

すべての Autopilot クラスタはリージョン単位であり、Autopilot の料金モデルが適用されます。

Standard モードでは、リージョンクラスタには、類似のゾーンクラスタまたはマルチゾーンクラスタよりも多くのプロジェクトのリージョン割り当てが必要になります。リージョンクラスタを使用する前に、割り当てと Standard の料金を確実に理解してください。Insufficient regional quota to satisfy request for resource エラーが発生した場合、そのリクエストは現在のリージョンで使用可能な割り当てを超えています。

また、複数のゾーンにまたがるノード間トラフィックに対しても料金が発生します。たとえば、あるゾーンで実行中のワークロードが別のゾーンのワークロードと通信する必要がある場合、ゾーン間トラフィックが課金されます。詳細については、Compute Engine の料金ページで同一リージョン内のゾーン間の下り（GB あたり）をご覧ください。

リージョンクラスタ内の永続ストレージ

ゾーン永続ディスクはゾーンリソースであり、リージョン永続ディスクはマルチゾーンリソースです。永続ストレージを追加するとき、ゾーンが指定されない限り、GKE はディスクを単一のランダムなゾーンに割り当てます。ゾーンの制御方法については、永続ディスクのゾーンをご覧ください。

リージョンクラスタの自動スケーリング

クラスタオートスケーラーを使用してリージョンの Standard モードのクラスタ内のノードプールを自動的にスケーリングする場合は、次の点に留意してください。

さらに、リージョンクラスタの自動スケーリングの制限に関する詳細や、クラスタオートスケーラーがゾーン間で均衡化を図る方法の詳細を確認することもできます。

これらの考慮事項は、クラスタオートスケーラーを備えた Standard モードのクラスタにのみ適用されます。

スケーリング制限のオーバープロビジョニング

万一ゾーンで障害が発生しても容量を維持できるように、GKE にスケーリング制限の超過を許可し、一部のゾーンが使用できない場合でも最小限の可用性を確保できます。

たとえば、3 つのゾーンにまたがるクラスタに対して 150%（50% の容量超過）のオーバープロビジョニングを設定すると、クラスタの容量の 3 分の 1 が失われたとしても、利用可能なゾーンにトラフィックの 100% が確実にルーティングされます。上記の例では、ゾーンごとの最大ノード数を 4 ではなく 6 に指定することでこれを実現できます。この場合、いずれか 1 つのゾーンで障害が発生すると、クラスタは残りのゾーン内にある 12 のノードにスケールします。

同様に、2 つのゾーンにまたがるクラスタに対して 200% のオーバープロビジョニングを設定すると、クラスタの容量の半分が失われたとしても、トラフィックの 100% が確実にルーティングされます。

Kubernetes のドキュメントでクラスタオートスケーラーの詳細や、自動スケーリングに関するよくある質問を確認できます。

リージョン クラスタ

リージョン クラスタの仕組み

制限事項

料金

リージョン クラスタ内の永続ストレージ

リージョン クラスタの自動スケーリング

スケーリング制限のオーバープロビジョニング

次のステップ

リージョンクラスタ

リージョンクラスタの仕組み

リージョンクラスタ内の永続ストレージ

リージョンクラスタの自動スケーリング