GKE の仕組み: コンテナ最適化コンピューティングにより、Autopilot の高速自動スケーリングを実現
Abdel Sghiouar
Senior Cloud Developer Advocate
Artemi Ollin
GKE Product Manager
※この投稿は米国時間 2025 年 8 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。
Google Kubernetes Engine (GKE)は、クラスタの計画と作成、アプリケーションのデプロイと管理、ネットワーキングの構成、セキュリティの確保、ワークロードのスケーリングなど、管理の容易さを備えた Kubernetes の力を活用できます。しかし、ワークロードの自動スケーリングに関しては、フルマネージドの運用モードである GKE Autopilot が、お客様が必要とするスピードと効率性を必ずしも実現できていないという声が寄せられています。これは、Kubernetes クラスタの自動スケーリングでは、新しいノードの作成と追加が必要になるためであり、時には数分かかることがあります。大量のデータを高速で処理するアプリケーションの場合、これでは十分ではありません。
このため、GKE Autopilot 向けのコンテナ最適化コンピューティング プラットフォームが登場しました。これは、今年初めに導入された、GKE 向けの完全に再構築された自動スケーリング スタックです。このブログでは、GKE Autopilot の自動スケーリングについて詳しく説明するとともに、この新しいコンテナ最適化コンピューティング プラットフォームをワークロードに今すぐ使用する方法をご紹介します。
GKE Autopilot とそのスケーリングの課題について
フルマネージド バージョンの Kubernetes である GKE Autopilot では、ユーザーが主にアプリケーションを管理する一方で、GKE がノードとノードプールの管理、新しいノードの作成、アプリケーションのスケーリングといった手間のかかる作業を引き受けます。従来の Autopilot では、アプリケーションを迅速にスケーリングする必要がある場合、GKE はまずアプリケーションをスケーリングできる新しいノードをプロビジョニングする必要があり、これには数分かかることもありました。
これを回避するために、ユーザーは「バルーン Pod」などの手法をよく使用していました。これは、優先度の低いダミーの Pod を作成してノードを保持するというものです。これにより、要求の厳しいスケーリングのユースケースで即座に容量を確保できました。しかし、このアプローチは、アクティブに使用されていないリソースを保持する必要があるため費用がかかり、維持も困難です。
コンテナ用に最適化されたコンピューティング プラットフォームの紹介
Google は、コンテナ最適化コンピューティング プラットフォームを開発するにあたり、明確なミッションを掲げました。それは、お客様が必要とするときに、最適な価格とパフォーマンスで、ほぼリアルタイムの、垂直方向と水平方向にスケーラブルなコンピューティング容量を提供することです。これは、GKE の基盤となるコンピューティング スタックを根本的に再設計することで実現しました。
コンテナ最適化コンピューティング プラットフォームは、実行中に動的にサイズ変更できる新しい仮想マシン ファミリーで GKE Autopilot ノードを実行します。CPU の一部からすべてにおいて、ワークロードを中断することなくサイズ変更できます。スケーリングとサイズ変更の速度を向上させるために、GKE クラスタは、リソース需要の増加に応じてワークロードに自動的に割り当て可能な、専用の事前プロビジョニングされたコンピューティング容量のプールも維持するようになりました。さらに、GKE Autopilot ではリクエストしたコンピューティング容量に対してのみ料金が発生するため、事前プロビジョニングされた容量は料金に影響しません。
その結果、必要な場所とタイミングで容量を提供する柔軟なコンピューティングが実現しました。主な改善点は次のとおりです。
-
コンテナに最適化されたコンピューティングを使用しないクラスタと比較して、Pod のスケジューリング時間が最大 7 倍高速化
-
自動スケーリングが有効なアプリケーションのレスポンス時間が大幅に改善
-
Kubernetes 1.33 で Pod のインプレース サイズ変更が導入され、中断なしで Pod のサイズ変更が可能に
コンテナ最適化コンピューティング プラットフォームには、事前に有効化された高パフォーマンスの HorizontalPodAutoscaler(HPA)プロファイルも含まれており、次の機能を提供します。
-
水平スケーリングの反応時間が非常に安定
-
HPA 計算が最大 3 倍高速化
-
より高解像度の指標により、スケジューリングの決定が改善
-
最大 1,000 個の HPA オブジェクトのパフォーマンスを加速
これらの機能はすべて、GKE Autopilot 1.32 以降で標準搭載されています。
新しいプラットフォームの力は、レプリカ数が急速にスケールされるデモにより明らかで、新しい Pod がどれだけ迅速にスケジュールされるかを示しています。


コンテナ最適化コンピューティングの活用方法
GKE Autopilot でこれらの改善を活用するには、GKE Autopilot 1.32 以降に基づいて新しい GKE Autopilot クラスタを作成します。
既存のクラスタが古いバージョンを使用している場合は、1.32 以降にアップグレードして、コンテナ向けに最適化されたコンピューティング プラットフォームの新機能を利用してください。
パフォーマンスを最適化するには、ワークロードに汎用コンピューティング クラスを利用することをおすすめします。コンテナ最適化コンピューティング プラットフォームはさまざまなタイプのワークロードをサポートしていますが、特に最適なのはウェブ アプリケーションのように、段階的なスケーリングと小規模(2 CPU 以下)のリソース リクエストを必要とするサービスです。
また、コンテナ最適化コンピューティング プラットフォームは汎用性が高いですが、現時点では特定のデプロイタイプには適していません。
-
アンチアフィニティなどのノードあたり 1 つの Pod のデプロイ
-
バッチ ワークロード
コンテナ最適化コンピューティング プラットフォームは、GKE 内のアプリケーションの自動スケーリングを改善するうえで大きな進歩をもたらしており、今後さらに多くの機能が期待されています。GKE Autopilot で今すぐお試しください。

-シニア クラウド デベロッパー アドボケイト、Abdel Sghiouar
-GKE プロダクト マネージャー Artemi Ollin