このドキュメントでは、Google Kubernetes Engine に適用される割り当てと上限を示します。割り当ては Google Kubernetes Engine などの Google Cloud サービスによって定義され、ユーザーが使用できるカウント可能な共有リソースの量を指定します。システムの上限は、変更できない固定値です。
Google Cloud は、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストする手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
通常、割り当てを調整するには、Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。
GKE リソースにはシステムの上限もあります。システムの上限は変更できません。
プロジェクトあたりの上限
単一のプロジェクトで、ゾーンあたり最大 100 のゾーンクラスタと、リージョンあたり 100 のリージョン クラスタを作成できます。
注: Autopilot モードで作成されたクラスタは、リージョン クラスタとして事前構成されています。
クラスタあたりの上限
次の表に、GKE クラスタごとの上限を示します。
次の表に示す GKE バージョンは、クラスタノードとコントロール プレーンの両方に適用されます。
上限 | GKE Standard クラスタ | GKE Autopilot クラスタ |
---|---|---|
クラスタあたりのノード数 | 15,000 個のノード 注: 2,000 を超えるノードの実行を予定している場合は、リージョン クラスタを使用します。 注: 5,000 を超えるノードの実行は、限定公開クラスタまたは Private Service Connect を使用するクラスタで、GKE Dataplane V2 が無効になっている場合にのみ可能です。この割り当て上限を増やすには、サポートにお問い合わせください。 |
5,000 個のノード 注: 1,000 を超えるノードの実行を予定している場合は、GKE Autopilot バージョン 1.23 以降を使用します。 注: 400 を超えるノードを実行する場合は、以前のバージョンで作成したクラスタに対してクラスタサイズの割り当てを引き上げる必要があります。詳しくは、サポートまでお問い合わせください。 |
ノードプールあたりのノード数 | ゾーンあたり 1,000 個のノード ゾーンあたり 2,000 個の TPU ノード - 1.28.5-gke.135500、1.29.1-gke.1206000、1.30 以降のバージョンが必要です。 |
該当なし |
ゾーン内のノード数 |
|
該当なし |
ノードあたりの Pod 数1 | 256 個の Pod 注: 1.23.5-gke.1300 より前の GKE バージョンの場合、上限の Pod 数は 110 です。 |
8~256 の任意の値に動的に設定します。GKE は、クラスタサイズとワークロード数を考慮して、ノードあたりの最大 Pod 数をプロビジョニングします。
|
クラスタあたりの Pod 数2 | 200,000 個の Pod1 | 200,000 個の Pod |
クラスタあたりのコンテナ数 | 400,000 個のコンテナ | 400,000 個のコンテナ |
etcd データベースのサイズ | 6 GB | 6 GB |
プラットフォーム管理者として、GKE で実行される大規模なワークロードに割り当てがどのように影響するかを十分理解することをおすすめします。大規模なワークロードのその他の推奨事項、ベスト プラクティス、上限、割り当てについては、スケーラブルなクラスタを作成するためのガイドラインをご覧ください。
API リクエストの上限
Kubernetes Engine API のデフォルトのレート上限は 1 分あたり 3,000 リクエストであり、100 秒ごとに適用されます。
リソースの割り当て
ノード数が 100 未満のクラスタの場合、GKE はすべての Namespace に Kubernetes リソース割り当てを適用します。これらの割り当ては、クラスタにデプロイされたアプリケーションの潜在的なバグによって引き起こされる不安定性からクラスタのコントロール プレーンを保護します。これらの割り当ては GKE によって適用されるため、削除できません。
GKE は、ノードの数に比例してリソース割り当ての値を自動的に更新します。100 ノードを超えるクラスタの場合、GKE はリソース割り当てを削除します。
リソースの割り当てを調べるには、次のコマンドを使用します。
kubectl get resourcequota gke-resource-quotas -o yaml
特定の Namespace の値を表示するには、--namespace
オプションを追加してその Namespace を指定してください。
割り当て量を確認する
コンソール
- Google Cloud コンソールで [割り当て] ページに移動します。 [割り当て] ページには、GKE 割り当てに事前に限定された割り当てリストが表示されます。
- 正確な割り当てを検索するには、[表をフィルタリング] を使用します。割り当ての名前がわからない場合は、[割り当て] ページのリンクを使用します。
gcloud
- 割り当てを確認するには、次のコマンドを実行します。
gcloud compute project-info describe --project PROJECT_ID
PROJECT_ID
は、実際のプロジェクト ID に置き換えます。 - ある特定のリージョンで使用済みの割り当て量を確認するには、次のコマンドを実行します。
gcloud compute regions describe example-region