Containers & Kubernetes

ノードプールの高速な同時自動作成により GKE クラスタの自動スケーリングを加速

2026年2月2日

Daniel Kłobuszewski

Software Engineer, GKE

Eyal Yablonka

Product Manager, GKE

Try Gemini 3.1 Pro

Our most intelligent model available yet for complex tasks on Gemini Enterprise and Vertex AI

Try now

※この投稿は米国時間 2026 年 1 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

このたび、Google Kubernetes Engine（GKE）におけるノードプールの同時自動作成機能をリリースしました。これにより、プロビジョニングのレイテンシが大幅に減少し、自動スケーリングのパフォーマンスが向上します。社内ベンチマークでは、プロビジョニング速度が最大 85% 向上しています。デプロイ時間が短縮され、グッドプットが向上するため、特に異種ワークロード、マルチテナントクラスタ、複数の ComputeClass 優先度を使用するワークロード、大規模な AI トレーニングワークロードで効果を発揮します。この機能改良はすでに組み込まれており、保留中の Pod のノードプールを GKE が自動的に作成できるように設定すると適用されます。

問題点

GKE のノードプールは、同じ構成のノードをグループ化し、サイズ変更やアップグレードなどのオペレーションを統合します。空のノードプールの新規作成には 30～45 秒かかります。GKE では、Pod のリソースのニーズに基づいて、ノードプールの作成を自動化できます。

GKE ノード自動プロビジョニング（NAP）の以前のバージョンでは、オペレーションを 1 つずつ実行していたため、デプロイとスケーリングのレイテンシが増加していました。この点は、複数のノードプールを必要とするクラスタで特に顕著でした。新しいノードプールを 1 つ作成するのに必要な 30～45 秒が積み重なって、クラスタの自動スケーリングの全体的な応答性に影響を与えていました。ノードプールの作成中、他のノードプールのオペレーションは待機する必要がありました。

GKE ノードプールの自動作成機能は、Autopilot クラスタと Standard クラスタのどちらで使用するかにかかわらず、Autopilot モードの中核となる機能です。また、GKE Standard モードで運用している場合でも、必要に応じて使用できます。Autopilot によって新しい仮想マシン（VM）シェイプが追加されるたびに、内部で自動的にノードプールが作成されます。

解決策

ノードプールの同時作成がサポートされることで、システムが複数のオペレーションを同時に処理できるようになり、これまでより迅速にクラスタをデプロイして、さまざまなノードタイプにスケールアウトできます。この機能改良は、バージョン 1.34.1-gke.1829001 以降で有効です。GKE を最新バージョンにアップグレードするだけで、この機能改良をご利用いただけます。追加の構成は必要ありません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image2_yI6qepE.max-1400x1400.png

ベンチマークを実行して結果を直接確認する場合は、ベンチマークコードをご覧ください。

ノードプールの同時作成が重要な理由

ノードプールの同時自動作成は、幅広い GKE ユースケースに大きなメリットをもたらします。

異種ワークロードとマルチテナントクラスタ - AI や ML を含む多くのワークロードでは個別のノードプールが必要であり、1 つのクラスタで複数のテナントに対応することがよくあります。この結果、構成が異なる複数のノードプールが必要になり、これらを 1 つのクラスタ内で迅速かつ効率的にデプロイまたは管理しなければなりません。
AI ワークロードとマルチホスト TPU スライス - 多くのマルチホスト TPU スライスを使用するワークロードでは、スライスごとに個別のノードプールが必要です。複数の新しいノードプールを迅速かつ同時に作成できるため、スケーリングを迅速に行うことができます。一般に、ノードプールが同時に自動作成されることで、AI ワークロードはプロビジョニングのパフォーマンスとリソース使用率（グッドプット）の向上という恩恵を受けることができます。
スポットインスタンスと複数の ComputeClass 優先度による費用の最適化 - プリエンプティブルノードは、構成が同一であっても、プリエンプティブルでないノードプールとは別のノードプールに分離する必要があります。一般に、カスタム ComputeClass 優先度は通常、別々のノードプールで表されます。つまり、クラスタには多くの場合、異なる優先度に対応する個別のノードプールがあります。並列処理を使用することで、これらのシナリオにより適切に対処できるようになりました。

プロビジョニングの高速化と起動時間の短縮

Google Cloud は、お客様の GKE 環境のパフォーマンス強化に尽力しています。ノードプールの同時自動作成は、プロビジョニングのパフォーマンスを向上させる取り組みの一つです。また、高速起動ノードによるノード起動レイテンシの改善、イメージストリーミングによるコンテナ pull レイテンシの改善、コンテナ最適化コンピューティングプラットフォームによる Pod スケジューリングレイテンシの改善にも取り組んでいます。詳細と利用方法については、以下のリソースをご覧ください。