新しい GKE: Autopilot をすべての対象クラスタに拡張
William Denniss
Group Product Manager, Google Kubernetes Engine
※この投稿は米国時間 2025 年 9 月 25 日に、Google Cloud blog に投稿されたものの抄訳です。
Autopilot は、Google Kubernetes Engine(GKE)の運用モードで、フルマネージド環境を提供し、ワークロードのコンピューティング キャパシティのプロビジョニングなど、運用の詳細を処理します。Autopilot を使用すると、ノードレベルの詳細の管理に費やす時間を減らし、独自のアプリケーションの開発により多くの時間を費やすことができます。今年、Google は Autopilot の自動スケーリング スタックを完全にダイナミックなコンテナ最適化コンピューティング プラットフォームにアップグレードしました。このプラットフォームは、ワークロードをサポートするために水平方向と垂直方向に迅速にスケーリングします。HorizontalPodAutoscaler(HPA)または VerticalPodAutoscaler(VPA)を環境にアタッチするだけで、ユーザーにサービスを提供するために迅速にスケーリングできる、完全にダイナミックなプラットフォームを体験できます。
Hotspring や Contextual AI をはじめとする多くのお客様が、Autopilot で Kubernetes クラスタの運用を大幅に簡素化し、重要なワークロードのリソース効率を高められることを実感しています。実際、2024 年に作成されたアクティブな GKE クラスタの 30% が Autopilot モードで作成されました。新しいコンテナ最適化コンピューティング プラットフォームによって、プロビジョニング時間のパフォーマンスが急速に向上したと、お客様にも好評をいただいています。GKE が容量をプロビジョニングする速度が速いほど、ワークロードの応答性が高まり、お客様のエクスペリエンスが向上し、費用が最適化されます。
このたび、Autopilot の優れた機能が、専用の Autopilot クラスタだけでなく、すべての対象となる GKE クラスタで利用可能になったことをお知らせいたします。これにより、既存の GKE クラスタにおいても、Autopilot のコンテナ最適化コンピューティング プラットフォームを利用でき、簡単な操作性を得ることができるようになります。これは一般提供されており、Rapid リリース チャンネルに登録され、GKE バージョン 1.33.1-gke.1107000 以降を実行しているクラスタから利用できます。これらの新機能は、Extended チャンネルに登録されているクラスタと、古いルートベースのネットワーキングを使用しているクラスタを除いたほとんどのクラスタが対象となります。他のリリース チャンネルにロールアウトされ次第、本機能にアクセスできます。これらの新機能を利用するには、Rapid チャンネルに登録してクラスタのバージョンをアップグレードするか、自動アップグレードされるまでお待ちください。

使い方
Autopilot の機能は、Standard クラスタではコンピューティング クラスを通じて提供されます。これは、GKE のワークロードのコンピューティング要件をグループ化して指定する最新の方法です。GKE には、組み込みのコンピューティング クラスが 2 つあります。autopilot
と autopilot-spot
です。これらは、GKE 1.33.1-gke.1107000 以降で実行され、Rapid リリース チャンネルに登録されているすべての対象クラスタにプリインストールされています。Autopilot のコンテナ最適化コンピューティング プラットフォームでワークロードを実行するには、次のように autopilot
(または autopilot-spot
)コンピューティング クラスを指定するだけです。
さらに、Autopilot のコンテナ最適化コンピューティング プラットフォームを名前空間のデフォルトに設定することもできます。これは、時間と費用の両方を節約する優れた方法です。効率的なビンパッキングにより、ワークロードはリソース リクエストに対して課金され、迅速なスケーリングが実現します。バーストも使用でき、ノードの形状やサイズを計画する必要もありません。
名前空間のデフォルトとして Autopilot を設定する方法は次のとおりです。
コンテナ最適化コンピューティング プラットフォームの Pod サイズは、50 ミリ CPU(1 CPU コアのわずか 5%)から始まり、28 vCPU までスケールできます。コンテナ向けに最適化されたコンピューティング プラットフォームでは、Pod がリクエストしたリソースに対してのみ料金が発生するため、システム オーバーヘッドや空のノードについて心配する必要はありません。28 個を超える vCPU を使用する Pod や、特定のハードウェア要件を持つ Pod も、カスタマイズされたコンピューティング クラスを介してノードベースの料金設定で特殊なコンピューティング上で Autopilot モードで実行できます。
Autopilot で GPU と TPU 上の AI ワークロードを実行する
Autopilot のコンテナ最適化コンピューティング プラットフォームと、GPU、TPU、高性能 CPU などの特定のハードウェアを簡単に組み合わせて、AI ワークロードを実行できます。これらのワークロードは、コンテナ最適化コンピューティング プラットフォーム上の同じクラスタ内で、Pod を並べて実行できます。これらの AI ワークロードに Autopilot モードを選択すると、Google がより積極的に管理に関わる Autopilot のマネージド ノード プロパティのメリットが得られます。さらに、ユーザー空間でワークロードを実行することを要求する、エンタープライズ グレードの特権アドミッション コントロールも利用できるため、サポート性、信頼性、セキュリティ ポスチャーが向上します。
Autopilot モードで特定のハードウェア(この例では NVIDIA L4 を搭載した G2 マシンタイプ)で実行される独自のカスタム コンピューティング クラスを定義する方法は次のとおりです。2 つの優先度ルールがあります。
コンピューティング クラスの新しい使い方
また、コンピューティング クラスがより効果的に機能するように、新しいプロビジョニング モードを導入します。このモードでは、既存のノードプールで他のワークロードがスケジュールされる方法を変更することなく、コンピューティング クラスのリソースが自動的にプロビジョニングされます。つまり、既存のワークロードやデプロイ戦略に影響を与えることなく、コンピューティング クラス(新しい Autopilot 対応コンピューティング クラスを含む)の新しいデプロイ パラダイムを独自のペースで採用できるようになりました。
これまでは、Standard クラスタでノードの自動プロビジョニング付きのコンピューティング クラスを使用するには、クラスタ全体でノード自動プロビジョニングを有効にする必要がありました。ノード自動プロビジョニングは長年にわたって GKE の一部でしたが、以前は全か無かの選択でした。つまり、ノード自動プロビジョニングを使用するコンピューティング クラスと手動のノードプールを簡単に組み合わせることはできませんでした。コンピューティング クラス外のワークロードのスケジュール設定方法が変更される可能性があったためです。しかし、自動プロビジョニングされる新しいコンピューティング クラスを使用すれば、これが可能になります。すべての Autopilot コンピューティング クラスでこのシステムが使用されるため、既存のデプロイ(手動ノードプールなど)と並行して Autopilot モードでワークロードを簡単に実行できます。また、GKE バージョン 1.33.3-gke.1136000 以降を実行している Rapid チャンネルのクラスタから、任意のコンピューティング クラスでこの機能を有効にすることもできます。
手順は次のとおりです。
Standard クラスタのコンピューティング クラスの Autopilot モードと、すべてのコンピューティング クラスの新しい自動プロビジョニング モードにより、既存のワークロードのスケジュール設定方法に影響を与えることなく、より多くのクラスタにコンピューティング クラスをオプションとして導入できるようになりました。このアプローチは、お客様にも好印象をいただいているようです。破壊的な切り替えを計画する必要がなく、新しいワークロードに徐々に新しいパターンを採用し、既存のワークロードを移行できるからです。
Autopilot をすべてのお客様に
Google Cloud は、GKE の Autopilot モードが GKE クラスタの運用を簡素化し、効率を高める力を持っていると確信しています。このたび、これらのメリットがすべての GKE のお客様にご利用いただけるようになりました。GKE Autopilot の詳細と、クラスタで GKE Autopilot を有効にする方法については、以下のリソースをご覧ください。
-
コンテナ最適化コンピューティングが内部でどのように機能してパフォーマンスを向上させるかを確認する。
-
NEXT ‘25 の GKE スポットライトを視聴し、発表を確認する。
-Google Kubernetes Engine、グループ プロダクト マネージャー William Denniss