このページは Cloud Translation API によって翻訳されました。

GKE クラスタの自動スケーリングについて

Autopilot Standard

このページでは、Google Kubernetes Engine（GKE）がワークロードの需要に基づいて Standard クラスタのノードプールのサイズを自動的に変更する方法について説明します。需要が高い場合、クラスタのオートスケーラーはノードプールにノードを追加します。クラスタオートスケーラーの構成方法については、クラスタの自動スケーリングをご覧ください。

このページは、容量とインフラストラクチャのニーズを計画し、システムアーキテクチャとリソースを最適化して、会社またはビジネスユニットの総所有コストを最小限に抑える管理者、アーキテクト、オペレーターを対象としています。 Google Cloud のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE ユーザーロールとタスクをご覧ください。

Autopilot クラスタを使用すると、ノードプールがノード自動プロビジョニングによって自動的にプロビジョニングされ、またワークロードの要件に合わせて自動的にスケーリングされるため、ノードのプロビジョニングやノードプールの管理について心配する必要はありません。

このページを読む前に、基本的な Kubernetes のコンセプトと、リソースリクエストとリソース上限の仕組みを理解しておいてください。

ベストプラクティス:

組織の管理者、アーキテクト、デベロッパー、またはアプリケーションの実装とメンテナンスを担当する他のチームと協力して、クラスタ構成を計画し、設計します。

クラスタオートスケーラーを使用する理由

GKE クラスタオートスケーラーは、ワークロードの需要に基づいて、特定のノードプール内のノード数を自動的に変更します。需要が少ない場合、クラスタのオートスケーラーは指定した最小サイズにスケールダウンします。これにより、ワークロードの可用性が向上し、コストも抑えられます。ノードを手動で追加または削除する必要はありません。また、ノードプールを過剰にプロビジョニングする必要もありません。ノードプールの最小サイズと最大サイズを指定するだけで、あとは自動的に設定されます。

クラスタの自動スケーリング時にリソースを削除または移動すると、ワークロードが一時的に中断することがあります。たとえば、ワークロードが 1 つのレプリカを持つコントローラで構成されている場合、現在のノードを削除すると、レプリカのポッドは別のノードに再スケジュールされる可能性があります。クラスタオートスケーラーを有効にする前に、一時的な中断が許容されるようにワークロードを設計するか、重要な Pod で割り込みが発生しないように設計してください。

ベストプラクティス:

中断に対するワークロードの許容度を高めるには、Deployment などの複数のレプリカを持つコントローラを使用して、ワークロードをデプロイします。

クラスタオートスケーラーのパフォーマンスを向上させるには、イメージストリーミングを使用します。これにより、対象となるコンテナイメージから必要なイメージデータがリモートでストリーミングされると同時に、イメージがローカルのキャッシュに保存され、新しいノードのワークロードが迅速に開始できるようにします。

クラスタオートスケーラーの仕組み

クラスタオートスケーラーはノードプールごとに機能します。クラスタオートスケーラーを使用してノードプールを構成する場合は、ノードプールの最小サイズと最大サイズを指定します。

クラスタオートスケーラーは、ノードプールの基盤となる Compute Engine マネージドインスタンスグループ（MIG）で仮想マシン（VM）インスタンスを追加または削除して、ノードプールのサイズを自動的に調整します。クラスタオートスケーラーは、実際のリソース使用率ではなくノードプールのノードで実行されている Pod のリソースリクエスト数に基づいてスケーリングを決定します。Pod とノードのステータスを定期的にチェックし、次の処理を行います。

現在のノードに Pod をスケジュールできない場合、クラスタオートスケーラーはノードプールの最大サイズまでノードを追加します。クラスタオートスケーラーがクラスタのサイズを変更するタイミングについては、クラスタオートスケーラーがクラスタのサイズを変更するタイミングをご覧ください。
GKE がノードプールに新しいノードを追加することを決定した場合、クラスタオートスケーラーは、ノードプールごとまたはクラスタごとの上限まで、必要に応じてノードを追加します。
クラスタオートスケーラーは、ノードを順番に作成するわけではありません。GKE が作成するノードの数を決定すると、ノードの作成は並行して行われます。目的は、スケジューリングできない Pod が Active になるまでの時間を最小限に抑えることです。
割り当てが不足して一部のノードが作成されない場合、クラスタオートスケーラーはリソースが正常にスケジュールされるまで待機します。
ノードの使用率が低く、ノードプール内のノード数を少なくしてもすべての Pod のスケジューリングが可能な場合、クラスタオートスケーラーはノードプールの最小サイズになるまでノードを削除します。クラスタ内の他のノードに移動できないノードに Pod がある場合、クラスタオートスケーラーはそのノードをスケールダウンしません。Pod を他のノードに移動できても、タイムアウト期間（現在は 10 分）の経過後にノードを正常にドレインできない場合、ノードは強制終了されます。GKE クラスタの猶予期間は構成できません。スケールダウンの仕組みについて詳しくは、クラスタオートスケーラーのドキュメントをご覧ください。

クラスタオートスケーラーがクラスタを検査してスケジューリングできない Pod を探す頻度は、クラスタのサイズに大きく依存します。小規模なクラスタでは、検査は数秒ごとに行われる場合があります。この検査に必要な正確な期間を定義することはできません。

Pod がリクエストするリソースが少なすぎる場合、あるいは、過小なデフォルト値をそのまま使用している場合、クラスタオートスケーラーで状況を改善することはできません。クラスタオートスケーラーが正常に動作するように、すべてのワークロードに明示的なリソースリクエストを行う必要があります。

クラスタのノードで、マネージドインスタンスグループに対する Compute Engine の自動スケーリングを有効にしないでください。GKE のクラスタオートスケーラーは、Compute Engine の自動スケーリングとは別のものです。Compute Engine オートスケーラーが GKE のクラスタオートスケーラーと競合するため、ノードプールのスケールアップまたはスケールダウンに失敗する場合があります。

動作条件

ノードプールのサイズを変更する場合、クラスタオートスケーラーは次のことを前提とします。

複製対象のすべての Pod を他のノードで再起動できます。これにより、短い中断が発生する可能性があります。
ユーザーまたは管理者はノードを手動で管理しません。クラスタオートスケーラーによって、手動で行ったノード管理オペレーションが無効になる可能性があります。
1 つのノードプール内のすべてのノードに同じラベルセットが使用されます。
クラスタオートスケーラーは、各プール内のインスタンスタイプの相対的なコストを考慮し、最もコストのかからないノードプールを拡張しようとします。ただし、クラスタオートスケーラーのこの動作には次の条件が適用されます。
- クラスタオートスケーラーは、プリエンプティブルな Spot VM を含むノードプールのコスト削減を考慮します。ただし、クラスタオートスケーラーは各ゾーンのリソースの可用性も考慮するため、よりコストのかかる使用可能なリソースを選択する場合があります。
- 複数のノードプールで Spot VM が使用されている場合、クラスタオートスケーラーは最も低コストのオプションを自動的に選択しません。費用対効果の高い Spot VM の使用を最適化し、このシナリオを防ぐには、カスタムコンピューティングクラスを使用することをおすすめします。
クラスタオートスケーラーは、Pod をスケジューリングする前に init コンテナのリクエストを考慮します。init コンテナのリクエストでは、ノードで利用可能な未割り当てリソースが使用可能であるため、Pod をスケジューリングできない可能性があります。クラスタオートスケーラーは、Kubernetes で使用されるものと同じリクエスト計算ルールに従います。詳細については、init コンテナの使用に関する Kubernetes のドキュメントをご覧ください。
最初のクラスタまたはノードプールの作成後に手動で追加されたラベルは追跡されません。クラスタオートスケーラーによって作成されたノードには、ノードプールの作成時に --node-labels で指定されたラベルが割り当てられます。
GKE バージョン 1.21 以前では、クラスタオートスケーラーはノードプールの既存のノードの taint 情報をノードプール全体を表すものと見なします。GKE バージョン 1.22 以降、クラスタオートスケーラーは、クラスタ内の既存のノードとノードプールからの情報を結合します。クラスタオートスケーラーは、ノードとノードプールに手動で加えた変更も検出します。

ベストプラクティス:

アプリケーションで中断が許容される場合は、クラスタオートスケーラーを有効にしないでください。

ゾーン間での均衡化

ノードプールに同じインスタンスタイプを持つ複数のマネージドインスタンスグループが含まれている場合、クラスタオートスケーラーは、スケールアップ時にこうしたマネージドインスタンスグループのサイズの均衡化を図ります。これにより、ノードプールの複数のゾーン内にあるマネージドインスタンスグループ間でノードの分配が不均一になる事態を回避できます。GKE はスケールダウン時に自動スケーリングポリシーを考慮しません。

クラスタオートスケーラーがゾーン間で均衡化を図るのは、スケールアップ時のみです。スケールダウン時には、ノードプール内の基盤マネージドインスタンスグループの相対サイズに関係なく、使用率の低いノードが削除されるため、ゾーン間でノードの分配が不均一になる可能性があります。

ロケーションポリシー

GKE バージョン 1.24.1-gke.800 以降では、クラスタオートスケーラーのロケーションポリシーを変更できます。クラスタオートスケーラーの配布ポリシーは、location_policy フラグに次のいずれかの値を指定することにより制御できます。

BALANCED: クラスタオートスケーラーは、Pod の要件と各ゾーンのリソースの可用性を考慮します。クラスタオートスケーラーは、特定のゾーン内で使用可能な容量や、スケールアップをトリガーした Pod のゾーンアフィニティなど、多くの要因を考慮するため、同様のノードグループのサイズがまったく同じになるとは限りません。
ANY: クラスタオートスケーラーは、未使用の予約とアカウントの利用を優先させ、使用可能なリソースの現在の制約を考慮します。

ベストプラクティス:

Spot VM を使用している場合や、ゾーン間で均等でない VM 予約を使用する場合は、ANY ポリシーを使用します。

予約

GKE バージョン 1.27 以降では、クラスタオートスケーラーは、スケールアップの決定時に常に予約を考慮します。未使用の予約と一致するノードプールは、ノードプールが最も効率的なものでない場合でも、スケールアップするノードプールを選択する際に優先されます。また、マルチゾーンのスケールアップの均衡化を図る際には、未使用の予約が常に優先されます。

ただし、クラスタオートスケーラーが確認するのは、独自のプロジェクト内の予約のみです。そのため、クラスタの独自プロジェクト内でより低コストなノードオプションが使用可能な場合、オートスケーラーは共有予約ではなく、そのオプションを選択する可能性があります。プロジェクト間で予約を共有する必要がある場合は、カスタムコンピューティングクラスの使用を検討してください。これにより、クラスタオートスケーラーがノード（共有予約を含む）のスケーリングに使用する優先度を構成できます。

デフォルト値

Spot VM ノードプールの場合、デフォルトのクラスタオートスケーラー配布ポリシーは ANY です。このポリシーでは、Spot VM がプリエンプトされるリスクが低くなります。

プリエンプティブル以外のノードプールの場合、デフォルトのクラスタオートスケーラー配布ポリシーは BALANCED です。

ノードプールの最小サイズと最大サイズ

新しいノードプールを作成するときに、クラスタ内の各ノードプールの最小サイズと最大サイズを指定できます。クラスタオートスケーラーは、これらのスケーリングの制約内で再スケーリングを決定します。最小サイズを更新するには、新しい最小値を指定してから、クラスタを新しい制約内のサイズに手動でサイズ変更します。クラスタオートスケーラーは、新しい制約に基づいて再スケーリングを決定します。

現在のノードプールサイズ	クラスタオートスケーラーのアクション	スケーリングの制約
指定した最小値を下回っている	クラスタオートスケーラーは、保留中の Pod をプロビジョニングするためにスケールアップします。スケールダウンが無効になります。	ノードプールは、指定した値以下にスケールダウンされません。
指定した最小サイズと最大サイズの範囲内	クラスタオートスケーラーは、需要に応じてスケールアップまたはスケールダウンします。	ノードプールは、指定したサイズの制限内に収まります。
指定した最大値を超えている	クラスタオートスケーラーは、安全に削除できるノードのみをスケールダウンします。スケールアップが無効になります。	ノードプールは、指定した値を超えてスケーリングすることはありません。

Standard クラスタでは、クラスタオートスケーラーがクラスタをゼロノードまで自動的にスケールダウンすることはありません。システム Pod を実行するには、クラスタ内で 1 つ以上のノードが常に使用可能である必要があります。また、ノードを手動で削除したために現在のノード数がゼロになっている場合は、クラスタオートスケーラーとノードの自動プロビジョニングにより、ゼロノードクラスタからスケールアップされます。

オートスケーラーの決定の詳細については、クラスタオートスケーラーの制限をご覧ください。

自動スケーリングの制限

クラスタオートスケーラーがノードプールをスケーリングするときに使用するノードの最小数と最大数を設定できます。--min-nodes フラグと --max-nodes フラグを使用して、ゾーンあたりのノードの最小数と最大数を設定します。

GKE バージョン 1.24 以降では、新しいクラスタに --total-min-nodes フラグと --total-max-nodes フラグを使用できます。これらのフラグは、すべてのゾーンのノードプール内にあるノードの最小数と最大数を設定します。

最小ノード数と最大ノード数の例

次のコマンドでは、6 ノードから構成される自動スケーリングのマルチゾーンクラスタを 3 つのゾーンに作成します。各ゾーンの最小ノード数は 1、最大ノード数は 4 になります。

gcloud container clusters create example-cluster \
    --num-nodes=2 \
    --location=us-central1-a \
    --node-locations=us-central1-a,us-central1-b,us-central1-f \
    --enable-autoscaling --min-nodes=1 --max-nodes=4

この例では、クラスタの合計サイズは 3～12 ノードで、これらのノードは 3 つのゾーンに分散しています。いずれかのゾーンで障害が発生すると、クラスタの合計サイズは 2～8 ノードになります。

合計ノード数の例

GKE バージョン 1.24 以降で利用可能な次のコマンドは、最初に 3 つのゾーンに 6 つのノードを持つ自動スケーリングマルチゾーンクラスタを、すべてのゾーンで、ノードプール内の最小 3 つ、最大 12 個のノードで作成します。

gcloud container clusters create example-cluster \
    --num-nodes=2 \
    --location=us-central1-a \
    --node-locations=us-central1-a,us-central1-b,us-central1-f \
    --enable-autoscaling --total-min-nodes=3 --total-max-nodes=12

この例では、ゾーン間の分散に関係なく、クラスタの合計サイズを 3～12 ノードにできます。

自動スケーリングプロファイル

ノードを削除するタイミングを決定することは、使用率の最適化とリソースの可用性とのトレードオフです。使用率の低いノードを削除するとクラスタの使用率は向上しますが、新しいワークロードの実行の際に、リソースが再度プロビジョニングされるのを待機しなければならない状況が生じる可能性があります。

このような決定を行うときに使用する自動スケーリングプロファイルを指定できます。利用可能なプロファイルは以下のとおりです。

balanced: 受信 Pod で使用可能なリソースを増やすことを優先し、Standard クラスタでリソースを有効にする時間を短縮するデフォルトのプロファイル。balanced プロファイルは、Autopilot クラスタでは使用できません。
optimize-utilization: クラスタ内で余剰リソースを保持するよりも使用率の最適化を優先させます。このプロファイルを有効にすると、クラスタオートスケーラーはクラスタをより積極的にスケールダウンします。GKE は、ノードをより多く、より迅速に削除できます。GKE は、すでに CPU、メモリ、または GPU が大量に割り当てられているノードで Pod をスケジュールすることを優先します。ただし、同じ Deployment、StatefulSet、Service に属する Pod のノード間の分散など、他の要因はスケジューリングに影響します。

optimize-utilization 自動スケーリングプロファイルを使用すると、クラスタオートスケーラーが使用率の低いノードを特定して削除しやすくなります。この最適化を実現するために、GKE により Pod 仕様のスケジューラ名が gke.io/optimize-utilization-scheduler に設定されます。カスタムスケジューラを指定する Pod は影響を受けません。

次のコマンドを使用すると、既存のクラスタで optimize-utilization 自動スケーリングプロファイルが有効になります。

gcloud container clusters update CLUSTER_NAME \
    --autoscaling-profile optimize-utilization

Pod のスケジューリングと停止の考慮

スケールダウンする場合、クラスタオートスケーラーは、Pod に設定されているスケジューリングルールとエビクションルールを考慮します。この制限により、オートスケーラーによってノードが削除されるのを防ぐことができます。次のいずれかの条件を持つ Pod が含まれていると、ノードの削除を防ぐことができます。

Pod のアフィニティまたは反アフィニティルールにより、再スケジューリングが防止される。
Pod が、Deployment、StatefulSet、Job、ReplicaSet などのコントローラによって管理されていない。
Pod にローカルストレージがあり、GKE コントロールプレーンバージョンが 1.22 未満である。コントロールプレーンバージョン 1.22 以降の GKE クラスタでは、ローカルストレージを使用する Pod でスケールダウンがブロックされなくなりました。
Pod に "cluster-autoscaler.kubernetes.io/safe-to-evict": "false" アノテーションがある。
ノードの削除が、構成された PodDisruptionBudget を超える可能性があります。

クラスタオートスケーラーの詳細と中断を防ぐ方法については、クラスタオートスケーラーに関するよくある質問をご覧ください。

GKE での TPU の自動スケーリング

GKE は、ML ワークロードを高速化するために Tensor Processing Unit（TPU）をサポートしています。単一ホストの TPU スライスノードプールとマルチホストの TPU スライスノードプールはどちらも、自動スケーリングと自動プロビジョニングをサポートしています

GKE クラスタで --enable-autoprovisioning フラグを指定すると、GKE は、TPU のバージョンとトポロジが保留中のワークロードの要件を満たしている単一ホストまたはマルチホストの TPU スライスノードプールを作成または削除します。

--enable-autoscaling を使用すると、GKE はタイプに基づいてノードプールを次のようにスケーリングします。

単一ホストの TPU スライスノードプール: GKE は、既存のノードプールで TPU ノードを追加または削除します。ノードプールには、0 からノードプールの最大サイズまでの任意の数の TPU ノードが含まれます。最大サイズは、--max-nodes フラグと --total-max-nodes フラグによって決まります。ノードプールがスケーリングされると、ノードプール内のすべての TPU ノードのマシンタイプとトポロジは同じになります。単一ホストの TPU スライスノードプールを作成する方法については、ノードプールを作成するをご覧ください。
マルチホスト TPU スライスノードプール: GKE は、ノードプールを 0 から TPU トポロジを満たすために必要なノード数までアトミックにスケールアップします。たとえば、マシンタイプが ct5lp-hightpu-4t でトポロジが 16x16 の TPU ノードプールの場合、ノードプールには 64 個のノードが含まれます。GKE オートスケーラーは、このノードプールのノード数が 0 または 64 になるように調整します。スケールダウンすると、GKE はスケジュールされたすべての Pod を強制排除し、ノードプール全体が 0 になるようにドレインします。マルチホスト TPU スライスノードプールの作成方法については、ノードプールを作成するをご覧ください。

Spot VM とクラスタオートスケーラー

クラスタオートスケーラーは最もコストのかからないノードプールの拡張を優先するため、ワークロードとリソースの可用性で許容される場合、クラスタオートスケーラーはスケールアップ時に Spot VM を追加します。

ただし、クラスタオートスケーラーは Spot VM の追加を優先しますが、Pod の大部分がこれらのタイプの VM で実行されることが保証されるわけではありません。Spot VM はプリエンプトされることがあります。このプリエンプションにより、Spot VM 上の Pod が強制排除される可能性が高まります。強制排除される場合、終了するための猶予はわずか 15 秒です。

たとえば、10 個の Pod があり、オンデマンド VM と Spot VM が混在しているとします。

最初の段階では、Spot VM が使用不可だったため、10 個の Pod はオンデマンド VM で実行されています。
10 個の Pod すべては必要ないため、クラスタオートスケーラーは 2 つの Pod を削除し、余分なオンデマンド VM をシャットダウンします。
10 個の Pod が再び必要になったら、クラスタオートスケーラーは Spot VM を追加し（より低コストであるため）、その VM に 2 個の Pod をスケジュールします。残りの 8 個の Pod はオンデマンド VM に残ります。
クラスタオートスケーラーが再度スケールダウンする必要がある場合、Spot VM が最初にプリエンプトされ、ほとんどの Pod はオンデマンド VM で実行される可能性があります。

Spot VM を優先し、上記のシナリオを回避するには、カスタムコンピューティングクラスを使用することをおすすめします。カスタムコンピューティングクラスを使用すると、スケールアップ時に Spot VM を優先する優先度ルールを作成できます。このルールでは、オンデマンドノードよりも高い優先度を Spot VM に付与します。Spot VM を基盤とするノードで Pod が実行される可能性を最大限に高めるには、アクティブな移行を構成します。

次の例は、カスタムコンピューティングクラスを使用して Spot VM を優先させる方法の一つを示しています。

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: prefer-l4-spot
spec:
  priorities:
  - machineType: g2-standard-24
    spot: true
    gpu:
      type: nvidia-l4
      count: 2
  - machineType: g2-standard-24
    spot: false
    gpu:
      type: nvidia-l4
      count: 2
  nodePoolAutoCreation:
    enabled: true
  activeMigration:
    optimizeRulePriority: true

上記の例の優先度ルールでは、g2-standard-24 マシンタイプと Spot VM を優先的に使用してノードを作成するよう指定しています。Spot VM が使用できない場合、GKE はフォールバックオプションとしてオンデマンド VM を使用します。このコンピューティングクラスでは、activeMigration も有効になっています。そのため、容量が使用可能になると、クラスタオートスケーラーがワークロードを Spot VM に移行できます。

カスタムコンピューティングクラスを使用できない場合は、ノードアフィニティ、taint、tolerationを追加します。たとえば、次のノードアフィニティルールでは、Spot VM を基盤とするノードで優先的に Pod をスケジュールするよう指定しています（GKE は、これらのタイプのノードに cloud.google.com/gke-spot=true ラベルを自動的に追加します）。

affinity:
  nodeAffinity:
    preferredDuringSchedulingIgnoredDuringExecution:
    - weight: 1
    preference:
      matchExpressions:
      - key: cloud.google.com/gke-spot
        operator: Equal
        values:
        - true

ノードアフィニティ、taint、toleration を使用して Spot VM をスケジュールする方法については、オンデマンドノードをフォールバックとして Spot ノード上で GKE アプリケーションを実行する方法についてのブログをご覧ください。

ProvisioningRequest CRD

ProvisioningRequest は、ユーザーがクラスタオートスケーラーから Pod のグループの容量をリクエストできる、Namespace 付きのカスタムリソースです。これは、相互接続された Pod を単一のユニットとしてまとめてスケジュールする必要があるアプリケーションに特に有用です。

サポートされているプロビジョニングクラス

サポートされている ProvisioningClass は次の 3 つです。

queued-provisioning.gke.io: この GKE 固有のクラスは、Dynamic Workload Scheduler と統合されています。ユーザーはリクエストをキューに格納し、リソースが使用可能になったときに処理されるように設定できます。これは、バッチジョブや遅延許容ワークロードに最適です。キューに格納されたプロビジョニングを GKE で使用する方法については、Dynamic Workload Scheduler を使用してバッチワークロードと AI ワークロード用に GPU をデプロイするをご覧ください。Standard クラスタでは GKE バージョン 1.28.3-gke.1098000 以降、Autopilot クラスタでは GKE バージョン 1.30.3-gke.1451000 以降でサポートされています。
check-capacity.autoscaling.x-k8s.io: このオープンソースクラスは、Pod のスケジュールを試みる前にリソースの可用性を検証します。GKE バージョン 1.30.2-gke.1468000 以降でサポートされています。
best-effort-atomic.autoscaling.x-k8s.io: このオープンソースクラスは、リクエスト内のすべての Pod のリソースをまとめてプロビジョニングしようとします。すべての Pod に十分なリソースをプロビジョニングできない場合、リソースはプロビジョニングされず、リクエスト全体が失敗します。GKE バージョン 1.31.27 以降でサポートされています。

CheckCapacity クラスと BestEffortAtomicScaleUp クラスの詳細については、オープンソースドキュメントをご覧ください。

ProvisioningRequest を使用する場合の制限事項

GKE クラスタオートスケーラーでは、ProvisioningRequest ごとに 1 つの PodTemplate のみがサポートされています。
GKE クラスタオートスケーラーでは、一度に 1 つのノードプールのみをスケールアップできます。ProvisioningRequest で複数のノードプールのリソースが必要な場合は、ノードプールごとに個別の ProvisioningRequest を作成する必要があります。

ProvisioningRequest を使用する際のベストプラクティス

total-max-nodes を使用する: ノードの最大数を制限する（--max nodes）代わりに、--total-max-nodes を使用して、アプリケーションが消費するリソースの合計を制限します。
location-policy=ANY を使用する: この設定では、使用可能なロケーションであればどこでも Pod をスケジュールできます。そのため、プロビジョニングを迅速化し、リソース使用率を最適化できます。
（省略可）Kueue と統合する: Kueue によって ProvisioningRequest の作成が自動化されるため、ワークフローを効率化できます。詳細については、Kueue のドキュメントをご覧ください。

バックオフ期間

スケールアップオペレーションは、割り当て不足や IP アドレス枯渇などのノード作成エラーが原因で失敗することがあります。これらのエラーが発生すると、基盤となるマネージドインスタンスグループ（MIG）は、5 分間の初期バックオフの後にオペレーションを再試行します。エラーが続く場合、このバックオフ期間は指数関数的に増加し、最大 30 分になります。この期間中、クラスタオートスケーラーは、エラーが発生していないクラスタ内の他のノードプールをスケールアップできます。

その他の情報

クラスタオートスケーラーの詳細については、オープンソースの Kubernetes プロジェクトの自動スケーリングに関する FAQ をご覧ください。

制限事項

クラスタオートスケーラーには次の制限があります。

クラスタオートスケーラーはローカル PersistentVolume をサポートしていません。
1.24.5-gke.600 より前の GKE コントロールプレーンでは、Pod がエフェメラルストレージをリクエストするときに、クラスタオートスケーラーは、エフェメラルストレージとしてローカル SSD を使用するゼロノードでのノードプールのスケールアップをサポートしていません。
クラスタサイズの制限: 最大 15,000 ノード。このサイズのクラスタを実行する場合は、他のクラスタ制限とベストプラクティスを考慮してください。
スケールダウンの場合、ノードの Pod を別のノードに再スケジューリングするため、クラスタオートスケーラーは 10 分間の猶予期間を使用します。この期間が経過すると、ノードを強制終了します。
場合によっては、クラスタオートスケーラーのスケールダウンが完全でなく、スケールダウン後に余分なノードが存在することがあります。これは、必要なシステム Pod が別のノード用にスケジュールされているときに発生する可能性があります。これらのポッドを別のノードに移動するためのトリガーがないためです。使用率が低いノードがいくつかありますが、スケールダウンされません。どうしてでしょうか？をご覧ください。この制限を回避するには、Pod Disruption Budget を構成できます。
フィルタを変更したカスタムスケジュール設定はサポートされていません。
クラスタオートスケーラーは、保留中の Pod に新しいノードをプロビジョニングするかどうかを決定する際に、デフォルトの kube-scheduler の動作を考慮します。カスタムスケジューラの使用はサポートされていません。カスタムスケジューラを使用すると、予期しないスケーリング動作が発生する可能性があります。
Pod の PriorityClass 値が -10 以下の場合、ノードはスケールアップされません。詳細については、クラスタオートスケーラーが Pod の優先度とプリエンプションでどのような役割を果たしているかをご覧ください。
クラスタオートスケーラーには、新しいノードや Pod を追加するのに十分な IP アドレス空間が割り振られていないことがあり、その場合はスケールアップエラーが発生します。このエラーでは、eventResult イベントの理由が scale.up.error.ip.space.exhausted となります。ノードの IP アドレスを追加するには、プライマリサブネットを拡張するか、不連続マルチ Pod CIDRを使用して新しい IP アドレスを Pod に追加します。詳細については、Pod 用の空き IP スペースが不足しているをご覧ください。
GKE クラスタオートスケーラーは、オープンソースの Kubernetes プロジェクトのクラスタオートスケーラーとは異なります。GKE クラスタオートスケーラーのパラメータはクラスタ構成に依存し、変更される可能性があります。自動スケーリングの動作をより細かく制御する必要がある場合は、GKE クラスタオートスケーラーを無効にして、オープンソースの Kubernetes のクラスタオートスケーラーを実行します。ただし、オープンソースの Kubernetes では、 Google Cloud がサポートされていません。
自動スケーリングが有効になっている GKE ノードプールを削除すると、ノードに NoSchedule フラグが設定され、これらのノード上の Pod は直ちに強制排除されます。使用可能なリソースの急激な減少を抑えるために、ノードプールのオートスケーラーは同じノードプール内に新しいノードをプロビジョニングすることがあります。新しく作成されたこれらのノードはスケジューリングに使用できるようになり、強制排除された Pod はこれらのノードに再度スケジューリングされます。最終的に、新しくプロビジョニングされたノードとその Pod を含むノードプール全体が削除され、これによってサービスの中断が発生する可能性があります。回避策として、削除中にオートスケーラーが新しいノードをプロビジョニングしないように、削除を開始する前にノードプールの自動スケーリングを無効にします。
クラスタオートスケーラーは、スケーリングの決定を行うために、新しいノードで使用可能なリソースの量を予測する必要があります。DaemonSet Pod が含まれているため、使用可能なリソースが減少します。予測は 100% 正確ではありません。また、使用可能なリソースの量は GKE のバージョンによって異なる場合があります。したがって、特定のインスタンスタイプに合わせたワークロードのサイズ設定や制限はおすすめしません。代わりに、カスタムコンピューティングクラスの使用を検討してください。ワークロードで特定のインスタンスタイプをターゲットにする必要がある場合は、割り当て可能なリソースのバッファがノードに残るようにサイズ設定してください。この場合、関連するすべての DaemonSet Pod がワークロード Pod とともにノードに収まるようにする必要もあります。

既知の問題

GKE コントロールプレーンのバージョンが 1.22 より前の場合、GKE クラスタオートスケーラーは空の（ゼロノード）クラスタですべてのノードプールのスケールアップを停止します。この動作は、GKE バージョン 1.22 以降では生じません。

トラブルシューティング

トラブルシューティングのヒントについては、次のページをご覧ください。

GKE クラスタの自動スケーリングについて コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

クラスタ オートスケーラーを使用する理由

クラスタ オートスケーラーの仕組み

動作条件

ゾーン間での均衡化

ロケーション ポリシー

予約

デフォルト値

ノードプールの最小サイズと最大サイズ

自動スケーリングの制限

自動スケーリング プロファイル

Pod のスケジューリングと停止の考慮

GKE での TPU の自動スケーリング

Spot VM とクラスタ オートスケーラー

ProvisioningRequest CRD

サポートされているプロビジョニング クラス

ProvisioningRequest を使用する場合の制限事項

ProvisioningRequest を使用する際のベスト プラクティス

バックオフ期間

その他の情報

制限事項

既知の問題

トラブルシューティング

次のステップ

GKE クラスタの自動スケーリングについて

クラスタオートスケーラーを使用する理由

クラスタオートスケーラーの仕組み

ロケーションポリシー

自動スケーリングプロファイル

Spot VM とクラスタオートスケーラー

サポートされているプロビジョニングクラス

ProvisioningRequest を使用する際のベストプラクティス