垂直 Pod 自動スケーリング

このページでは、垂直 Pod 自動スケーリングについて概説します。また、VerticalPodAutoscaler カスタム リソースとそれに関連するタイプの参考資料も記載しています。

概要

垂直 Pod 自動スケーリングは、最適な CPU のための Pod と Pod で必要とされるメモリリソースのサイズを決定する自動スケーリング ツールです。Pod 内のコンテナに最新の CPU のリクエストと制限メモリのリクエストと制限を設定する代わりに、CPU リクエストとメモリ リクエストと上限の推奨値を指定するか、値を自動的に更新するように垂直 Pod 自動スケーリングを構成できます。

安定性とコスト効率のために、ワークロードに適切なリソースのリクエストと制限を設定することが重要です。Pod のリソースサイズがワークロードに必要なサイズよりも小さい場合、アプリケーションが抑制されたり、メモリ不足エラーのために失敗したりする可能性があります。リソースはサイズが大きすぎると無駄に消費され、結果として請求額も大きくなります。GKE でコスト最適化 Kubernetes アプリケーションを実行するためのベスト プラクティスで、自動スケーリングのベスト プラクティスについて学習してください。

垂直 Pod 自動スケーリングを構成するには、GKE クラスタで有効にし、VerticalPodAutoscaler という名前のカスタム リソース定義オブジェクトを作成します。Autopilot クラスタの場合、垂直 Pod 自動スケーリングはデフォルトで有効になっています。ただし、VerticalPodAutoscaler オブジェクトを作成して、垂直 Pod 自動スケーリングを構成する必要はあります。垂直 Pod 自動スケーリングの構成方法を学習してください。

利点

垂直 Pod 自動スケーリングには、次のような利点があります。

  • Pod が必要な分のリソースのみを使用するため、クラスタノードを効率的に利用できます。
  • Pod は、適切な量のリソースが利用可能なノードにスケジュールされます。
  • CPU リクエストやメモリ リクエストの適切な値を求めるために、時間のかかるベンチマーク タスクを実施する必要がありません。
  • オートスケーラーによって時間の経過とともに CPU リクエストとメモリ リクエストが自動的に調整されるので、人手によるメンテナンス時間を節約できます。

Google Kubernetes Engine(GKE)の垂直 Pod 自動スケーリングには、Kubernetes オープンソース オートスケーラーに比べて次のようなメリットがあります。

  • 推奨サイズを決定する際は、ノードサイズとリソースの割り当ての最大量を考慮する必要があります。

  • クラスタの容量を調整するようにクラスタ オートスケーラーに通知します。

  • 過去のデータを使用して、垂直 Pod オートスケーラーを有効にする前に収集された指標を提供します。

  • ワーカーノードにデプロイする代わりに、垂直 Pod オートスケーラー Pod をコントロール プレーン プロセスとして実行します。

制限事項

  • 垂直 Pod 自動スケーリングでは、リソース使用量の急増に基づいて推奨値が生成されることはありません。長期間の安定的な推奨値が提供されます。急増に対応するには、HorizontalPodAutoscaler を使用してください。

  • 垂直 Pod 自動スケーリングがサポートする VerticalPodAutoscaler オブジェクトの数は、1 クラスタあたり最大 500 です。

  • 水平 Pod 自動スケーリングと垂直 Pod 自動スケーリングを併用する場合、多次元 Pod 自動スケーリングを使用します。また、カスタム指標外部指標でも、水平 Pod 自動スケーリングと垂直 Pod 自動スケーリングを併用できます。

  • ワークロードの実際のメモリ使用量の可視性が制限されているので、JVM ベースのワークロードには垂直 Pod 自動スケーリングをまだ使用できません。

API リファレンス

これは v1 API リファレンスです。このバージョンの API を使用することを強くおすすめします。

VerticalPodAutoscaler v1 autoscaling.k8s.io

フィールド

TypeMeta

API グループ、バージョン、種類。

metadata

ObjectMeta

標準のオブジェクト メタデータ

spec

VerticalPodAutoscalerSpec

VerticalPodAutoscaler の目的の動作。

status

VerticalPodAutoscalerStatus

直近に観測された VerticalPodAutoscaler のステータス。

VerticalPodAutoscalerSpec v1 autoscaling.k8s.io

フィールド
targetRef

CrossVersionObjectReference

Deployment や StatefulSet など、オートスケーラーで制御する Pod のセットを管理するコントローラへのリファレンス。スケール サブリソースを含む任意のコントローラで VerticalPodAutoscaler を指定できます。通常、VerticalPodAutoscaler はコントローラの ScaleStatus から Pod セットを取得します。DaemonSet など、よく知られているコントローラの場合、VerticalPodAutoscaler はそのコントローラの仕様から Pod セットを取得します。

updatePolicy

PodUpdatePolicy

Pod の起動時に推奨アップデートを適用するかどうか、また Pod のライフサイクル期間中に推奨アップデートを適用するかどうかを指定します。

resourcePolicy

PodResourcePolicy

個々のコンテナに対する CPU リクエストおよびメモリ リクエストの調整方法に関するポリシーを指定します。リソース ポリシーを使用して、個々のコンテナの推奨事項に制約を設定できます。指定されていない場合、オートスケーラーは、追加の制約なしに、Pod 内のすべてのコンテナの推奨リソースを計算します。

recommenders

VerticalPodAutoscalerRecommenderSelector array

この VPA オブジェクトの推奨事項の生成を担当する Recommender。GKE によって提供されるデフォルトの Recommender を使用するには、空のままにします。 それ以外の場合、リストにはユーザーが指定した代替 Recommender のエントリが 1 つだけ含まれます。 GKE 1.22 以降でサポートされています。

VerticalPodAutoscalerList v1 autoscaling.k8s.io

フィールド

TypeMeta

API グループ、バージョン、種類。

metadata

ObjectMeta

標準のオブジェクト メタデータ

items

VerticalPodAutoscaler array

VerticalPodAutoscaler オブジェクトのリスト。

PodUpdatePolicy v1 autoscaling.k8s.io

フィールド
updateMode

string

ポッドの起動時に推奨アップデートを適用するかどうか、またポッドのライフサイクル期間中に推奨アップデートを適用するかどうかを指定します。有効な値は、「Off」、「Initial」、「Recreate」、「Auto」です。 値を指定しない場合、デフォルトは「Auto」です。

minReplicas

int32

Updater が Pod のエビクションを試行するために存続する必要があるレプリカの最小数(Pod 停止予算などの他のチェックが保留中)。 正の値のみ使用できます。デフォルトは「--min-replicas」フラグです。これは、GKE では 2 に設定されます。 GKE 1.22 以降でサポートされています。

PodResourcePolicy v1 autoscaling.k8s.io

フィールド
containerPolicies

ContainerResourcePolicy array

個々のコンテナに対するリソース ポリシーの配列。名前付きのコンテナごとに最大で 1 つのエントリを作成できます。また、必要に応じて、個別のポリシーを持たないすべてのコンテナを処理する「containerName = '*'」のワイルドカード エントリを 1 つ指定できます。

ContainerResourcePolicy v1 autoscaling.k8s.io

フィールド
containerName

string

ポリシーが適用されるコンテナの名前。指定しない場合、そのポリシーはデフォルト ポリシーとして機能します。

mode

ContainerScalingMode

コンテナの起動時に推奨アップデートを適用するかどうか、またコンテナのライフサイクル期間中に推奨アップデートを適用するかどうかを指定します。有効な値は、「Off」と「Auto」です。 値を指定しない場合、デフォルトは「Auto」です。

minAllowed

ResourceList

そのコンテナで許容される CPU リクエストとメモリ リクエストの最小値を指定します。 デフォルトでは、適用される最小値はありません。

maxAllowed

ResourceList

そのコンテナで許容される CPU リクエストとメモリ リクエストの最大値を指定します。 デフォルトでは、適用される最大値はありません。

ControlledResources

[]ResourceName

VerticalPodAutoscaler によって計算される(適用される可能性のある)最適化案の種類を指定します。空の場合、デフォルトの [ResourceCPU, ResourceMemory] が使用されます。

VerticalPodAutoscalerRecommenderSelector v1 autoscaling.k8s.io

フィールド
name

string

このオブジェクトに対するレコメンデーションの生成を担当する Recommender の名前。

VerticalPodAutoscalerStatus v1 autoscaling.k8s.io

フィールド
recommendation

RecommendedPodResources

CPU リクエストおよびメモリ リクエストの最新の推奨値。

conditions

VerticalPodAutoscalerCondition array

VerticalPodAutoscaler の現在のステータスを示します。

RecommendedPodResources v1 autoscaling.k8s.io

フィールド
containerRecommendation

RecommendedContainerResources array

個々のコンテナに関するリソース推奨値からなる配列。

RecommendedContainerResources v1 autoscaling.k8s.io

フィールド
containerName

string

推奨値が適用されるコンテナの名前。

target

ResourceList

そのコンテナに対する CPU リクエストとメモリ リクエストの推奨値。

lowerBound

ResourceList

そのコンテナに対する CPU リクエストとメモリ リクエストの推奨値の下限。この値は、アプリケーションが安定して動作するのに十分であるとは限りません。CPU リクエストとメモリ リクエストがこの値に満たない場合、パフォーマンスや可用性に重大な影響を及ぼす可能性があります。

upperBound

ResourceList

そのコンテナに対する CPU リクエストとメモリ リクエストの推奨値の上限。CPU リクエストとメモリ リクエストをこの値より大きくしても、無駄になる可能性があります。

uncappedTarget

ResourceList

オートスケーラーによって計算された最新のリソース推奨値。これは実際のリソース使用量に基づいており、ContainerResourcePolicy は考慮されません。実際のリソース使用量に基づく値が ContainerResourcePolicy に違反する場合は、推奨範囲から外れる可能性があります。このフィールドは、実際のリソース割り当てには影響しません。ステータスの表示にのみ使用されます。

VerticalPodAutoscalerCondition v1 autoscaling.k8s.io

フィールド
type

VerticalPodAutoscalerConditionType

記述する状態のタイプ。有効な値は、「RecommendationProvided」、「LowConfidence」、「NoPodsMatched」、「FetchingHistory」です。

status

ConditionStatus

状態のステータス。有効な値は、「True」、「False」、「Unknown」です。

lastTransitionTime

Time

状態のステータスが最後に遷移した時刻。

reason

string

最後のステータス遷移の理由。

message

string

人間が読める文字列で記述された、最後のステータス遷移についての詳細情報。

次のステップ