このドキュメントで説明しているプロダクト、GKE on Azure はメンテナンスモードになり、2027 年 3 月 17 日をもってご利用いただけなくなります。

クラスタオートスケーラーについて

このドキュメントでは、ノードプールのサイズを自動的に制御するクラスタオートスケーラーについて説明します。クラスタオートスケーラーは、ノードプール内のノード数の最小値と最大値を指定すると有効になります。これらの値は、ノードプールの作成またはノードプールの更新時に指定します。

GKE on Azure は、オープンソースの Kubernetes クラスタオートスケーラーを使用します。

ノードプールの自動スケーリング

クラスタオートスケーラーは、ワークロードの需要に基づいて、特定のノードプール内のノード数を自動的に変更します。ノードを手動で追加または削除する必要はありません。また、ノードプールを過剰にプロビジョニングする必要もありません。ノードプールの最小サイズと最大サイズを指定するだけで、あとは自動的に設定されます。

クラスタの自動スケーリング中にリソースを削除または移動する必要がある場合は、ワークロードが一時的に中断する可能性があります。たとえば、ワークロードが 1 つのレプリカを持つコントローラで構成されている場合、現在のノードを削除すると、レプリカの Pod は別のノードに再スケジュールされる可能性があります。このため、一時的な中断が発生する可能性を許容するようにワークロードを設計するか、重要な Pod で割り込みが発生しないように設計する必要があります。

クラスタオートスケーラーの仕組み

クラスタオートスケーラーはノードプール単位で機能します。クラスタオートスケーラーを使用してノードプールを構成する場合は、ノードプールの最小サイズと最大サイズを指定します。ノードプールの作成またはノードプールの更新時に、最小サイズと最大サイズを変更できます。

クラスタオートスケーラーは、実際のリソース使用率ではなく、ノードプール内のリソース要求に基づいて、ノードプールのサイズを自動的に増減します。クラスタオートスケーラーは、Pod オブジェクトがスケジュール不可能であり、リクエストに対応するためのノードプール内の容量が不足している場合にノードを追加します。

クラスタオートスケーラーは、ノードが十分に活用されておらず、すべての Pod オブジェクトが少数のノードでスケジュールされる可能性がある場合にも、ノードを削除します。ノードが 10 分後に正常にドレインされなかった場合、ノードは強制終了されます。この期間は構成できません。

Pod がリクエストするリソースが少なすぎる場合（たとえば、デフォルト値が過小な場合）、クラスタオートスケーラーは状況を改善できません。クラスタオートスケーラーが正常に動作するように、すべてのワークロードで適切なリソースリクエストを行う必要があります。詳細については、コンテナのリソースの管理をご覧ください。

Pod アノテーションとクラスタオートスケーラーの挙動

クラスタオートスケーラーは、スケーリングの決定を行う際に特定の Pod アノテーションを考慮します。たとえば、クラスタオートスケーラーは "cluster-autoscaler.kubernetes.io/safe-to-evict": "false" などの Pod アノテーションをサポートしています。このアノテーションを「false」に設定すると、スケールダウンイベント中に Pod をホストしているノードが削除されなくなります。これらのアノテーションを理解して使用すると、ワークロードの要件に合わせてオートスケーラーの挙動を微調整できます。

Pod アノテーションとそのクラスタオートスケーラーへの影響の詳細については、次のリソースをご覧ください。

クラスタオートスケーラーのよくある質問にある What types of pods can prevent CA from removing a node? をご覧ください。
Kubernetes クラスタオートスケーラーの公式ドキュメント

動作条件

クラスタオートスケーラーは、次のことを前提としてノードプールのサイズを変更します。

複製対象のすべての Pod オブジェクトを、他のノードで再起動できるものとします。これにより、短い中断が発生する可能性があります。ワークロードが中断を許容しない場合は、自動スケーリングを無効にしてノードプールで実行するようにワークロードを構成します。詳細については、ノード taint を使用してスケジューリングを制御するをご覧ください。
クラスタオートスケーラーは、手動で行ったノード管理オペレーションをオーバーライドできます。
1 つのノードプール内のすべてのノードは同じラベルセットを持つものとします。
クラスタオートスケーラーは、スケールアップ後にアイドル状態の CPU または未使用のメモリを持つ最小限のノードグループを選択します。この動作は、同じクラスタ内に異なるサイズのノード（たとえば、ハイ CPU やハイメモリノード）がある場合に、どのノードプールがスケールアップされるかに影響します。

ノードプールの最小サイズと最大サイズ

min-nodes フラグと max-nodes フラグを使用して、クラスタ内の各ノードプールの最小サイズと最大サイズを指定できます。自動スケーリングを無効にするには、min-nodes と max-nodes を同じ値に設定します。クラスタオートスケーラーは、このサイズの範囲内でスケーリングの決定を実行します。

ノードプールの最大サイズを設定する際には、すべてのワークロードを実行するのに十分な大きさであることを確認してください。クラスタ内のノードプールにすべてのワークロードを実行するのに十分なメモリと CPU がない場合、停止する可能性があります。

`PodDisruptionBudget` を使用してワークロードを保護する

PodDisruptionBudget を使用すると、GKE on Azure を構成してワークロードの中断を防ぐことができます。PodDisruptionBudget を作成するときは、使用可能な Pod レプリカの最小数、または特定のタイミングで使用できない可能性がある Pod レプリカの最大数を指定します。詳細については、アプリケーションの停止予算を指定するをご覧ください。

詳細

クラスタオートスケーラーの詳細と、中断を防ぐ方法については、次のリソースをご覧ください。

クラスタ オートスケーラーについて

ノードプールの自動スケーリング

クラスタ オートスケーラーの仕組み

Pod アノテーションとクラスタ オートスケーラーの挙動