Containers & Kubernetes

GKE の仕組み: コンテナ最適化コンピューティングにより、Autopilot の高速自動スケーリングを実現

2025年8月28日

Abdel Sghiouar

Senior Cloud Developer Advocate

Artemi Ollin

GKE Product Manager

Try Gemini 2.5

Our most intelligent model is now available on Vertex AI

Try now

※この投稿は米国時間 2025 年 8 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

Google Kubernetes Engine （GKE）は、クラスタの計画と作成、アプリケーションのデプロイと管理、ネットワーキングの構成、セキュリティの確保、ワークロードのスケーリングなど、管理の容易さを備えた Kubernetes の力を活用できます。しかし、ワークロードの自動スケーリングに関しては、フルマネージドの運用モードである GKE Autopilot が、お客様が必要とするスピードと効率性を必ずしも実現できていないという声が寄せられています。これは、Kubernetes クラスタの自動スケーリングでは、新しいノードの作成と追加が必要になるためであり、時には数分かかることがあります。大量のデータを高速で処理するアプリケーションの場合、これでは十分ではありません。

このため、GKE Autopilot 向けのコンテナ最適化コンピューティングプラットフォームが登場しました。これは、今年初めに導入された、GKE 向けの完全に再構築された自動スケーリングスタックです。このブログでは、GKE Autopilot の自動スケーリングについて詳しく説明するとともに、この新しいコンテナ最適化コンピューティングプラットフォームをワークロードに今すぐ使用する方法をご紹介します。

GKE Autopilot とそのスケーリングの課題について

フルマネージドバージョンの Kubernetes である GKE Autopilot では、ユーザーが主にアプリケーションを管理する一方で、GKE がノードとノードプールの管理、新しいノードの作成、アプリケーションのスケーリングといった手間のかかる作業を引き受けます。従来の Autopilot では、アプリケーションを迅速にスケーリングする必要がある場合、GKE はまずアプリケーションをスケーリングできる新しいノードをプロビジョニングする必要があり、これには数分かかることもありました。

これを回避するために、ユーザーは「バルーン Pod」などの手法をよく使用していました。これは、優先度の低いダミーの Pod を作成してノードを保持するというものです。これにより、要求の厳しいスケーリングのユースケースで即座に容量を確保できました。しかし、このアプローチは、アクティブに使用されていないリソースを保持する必要があるため費用がかかり、維持も困難です。

コンテナ用に最適化されたコンピューティングプラットフォームの紹介

Google は、コンテナ最適化コンピューティングプラットフォームを開発するにあたり、明確なミッションを掲げました。それは、お客様が必要とするときに、最適な価格とパフォーマンスで、ほぼリアルタイムの、垂直方向と水平方向にスケーラブルなコンピューティング容量を提供することです。これは、GKE の基盤となるコンピューティングスタックを根本的に再設計することで実現しました。

コンテナ最適化コンピューティングプラットフォームは、実行中に動的にサイズ変更できる新しい仮想マシンファミリーで GKE Autopilot ノードを実行します。CPU の一部からすべてにおいて、ワークロードを中断することなくサイズ変更できます。スケーリングとサイズ変更の速度を向上させるために、GKE クラスタは、リソース需要の増加に応じてワークロードに自動的に割り当て可能な、専用の事前プロビジョニングされたコンピューティング容量のプールも維持するようになりました。さらに、GKE Autopilot ではリクエストしたコンピューティング容量に対してのみ料金が発生するため、事前プロビジョニングされた容量は料金に影響しません。

その結果、必要な場所とタイミングで容量を提供する柔軟なコンピューティングが実現しました。主な改善点は次のとおりです。

コンテナに最適化されたコンピューティングを使用しないクラスタと比較して、Pod のスケジューリング時間が最大 7 倍高速化
自動スケーリングが有効なアプリケーションのレスポンス時間が大幅に改善
Kubernetes 1.33 で Pod のインプレースサイズ変更が導入され、中断なしで Pod のサイズ変更が可能に

コンテナ最適化コンピューティングプラットフォームには、事前に有効化された高パフォーマンスの HorizontalPodAutoscaler（HPA）プロファイルも含まれており、次の機能を提供します。

水平スケーリングの反応時間が非常に安定
HPA 計算が最大 3 倍高速化
より高解像度の指標により、スケジューリングの決定が改善
最大 1,000 個の HPA オブジェクトのパフォーマンスを加速

これらの機能はすべて、GKE Autopilot 1.32 以降で標準搭載されています。

新しいプラットフォームの力は、レプリカ数が急速にスケールされるデモにより明らかで、新しい Pod がどれだけ迅速にスケジュールされるかを示しています。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/coc-for-generic.gif

コンテナ最適化コンピューティングの活用方法

GKE Autopilot でこれらの改善を活用するには、GKE Autopilot 1.32 以降に基づいて新しい GKE Autopilot クラスタを作成します。

読み込んでいます...

既存のクラスタが古いバージョンを使用している場合は、1.32 以降にアップグレードして、コンテナ向けに最適化されたコンピューティングプラットフォームの新機能を利用してください。

パフォーマンスを最適化するには、ワークロードに汎用コンピューティングクラスを利用することをおすすめします。コンテナ最適化コンピューティングプラットフォームはさまざまなタイプのワークロードをサポートしていますが、特に最適なのはウェブアプリケーションのように、段階的なスケーリングと小規模（2 CPU 以下）のリソースリクエストを必要とするサービスです。

また、コンテナ最適化コンピューティングプラットフォームは汎用性が高いですが、現時点では特定のデプロイタイプには適していません。

アンチアフィニティなどのノードあたり 1 つの Pod のデプロイ
バッチワークロード

コンテナ最適化コンピューティングプラットフォームは、GKE 内のアプリケーションの自動スケーリングを改善するうえで大きな進歩をもたらしており、今後さらに多くの機能が期待されています。GKE Autopilot で今すぐお試しください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_NKiC2jh.max-1300x1300.jpg

-シニアクラウドデベロッパーアドボケイト、Abdel Sghiouar

-GKE プロダクトマネージャー Artemi Ollin

投稿先

Containers & Kubernetes

分散 AI と ML の未来に向けて Ray と Kubernetes をともに進化させる

執筆者: Andrew Sy Kim • 所要時間: 5 分

Containers & Kubernetes

Ray on GKE で Cloud TPU をよりネイティブに利用

執筆者: Nisha Mariam Johnson • 所要時間: 7 分

Containers & Kubernetes

Gemini CLI を使用して費用対効果の高い LLM ワークロードを GKE にデプロイする

執筆者: Shuwen Fang • 所要時間: 3 分

Containers & Kubernetes

GKE と Gemini CLI の組み合わせで広がる可能性

執筆者: Adam Parco • 所要時間: 3 分

GKE の仕組み: コンテナ最適化コンピューティングにより、Autopilot の高速自動スケーリングを実現

Abdel Sghiouar

Artemi Ollin

Try Gemini 2.5

GKE Autopilot とそのスケーリングの課題について

コンテナ用に最適化されたコンピューティング プラットフォームの紹介

コンテナ最適化コンピューティングの活用方法

関連記事

分散 AI と ML の未来に向けて Ray と Kubernetes をともに進化させる

Ray on GKE で Cloud TPU をよりネイティブに利用

Gemini CLI を使用して費用対効果の高い LLM ワークロードを GKE にデプロイする

GKE と Gemini CLI の組み合わせで広がる可能性

コンテナ用に最適化されたコンピューティングプラットフォームの紹介