Containers & Kubernetes

GKE ワークロードのサイズ適正化 - 提案から対処まで

2022年5月20日

Google Cloud Japan Team

※この投稿は米国時間 2022 年 5 月 20 日に、Google Cloud blog に投稿されたものの抄訳です。

Kubernetes のワークロードのサイズを適正化する方法にあまり詳しくない方にとって、嬉しいニュースです。本日 Google は、この複雑なタスクをサポートするための、すぐに使える完全組み込み型の機能をリリースします。これにより、Google Kubernetes Engine（GKE）でアプリケーションを実行する際に、最適化の機会を発見して、ワークロード固有のリソースリクエストに関する提案を把握できるエンドツーエンドのワークフローをご利用いただけるようになります。最も重要なのは、こうした推奨事項に数秒で対応できることです。

このワークロード最適化ワークフローを使えば、リソース浪費の最大の要因となりがちな Kubernetes のリソースリクエストの量と上限を確認しながら、アプリケーションのサイズを適正化できます。リソースリクエストを正しく構成することは、アイドル状態のクラスタと、実際のリソース使用量に応じてダウンスケールされたクラスタとの違いを生み出します。

GKE の初心者ならば、サイズ適正化ツールが推奨するリソースリクエスト設定に従うことで時間と費用を節約できます。GKE ですでにワークロードを実行している場合は、既存するデプロイメントの最適化の機会を迅速に評価するためにこの機能を使うこともできます。

もう一歩進んで、ワークロードをさらに最適化するには、この新しいワークロードサイズ適正化機能を GKE Autopilot と組み合わせてください。GKE Autopilot の料金は、Pod リソースリクエストの量に基づいて決まります。GKE Autopilot を使用すると、Pod リソースリクエスト量の最適化（必要最低量を上回っていた場合）の結果が請求内容に直接反映されます。

また、実際の使用量の推移に基づいて、個々の対象ワークロードのリソースリクエストに関する推奨事項を提供する Cloud Monitoring 用の新しい指標も導入されます。

GKE によるシームレスなワークロードのサイズ適正化

GKE でワークロードを実行する際は、費用最適化インサイトを使用して、クラスタとワークロードのサイズ適正化の機会をコンソールで直接見つけることができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_GKE_workload.max-1700x1700.jpg

この画面にはワークロードの実際の使用量が表示され、リソースリクエスト量が少ないために信頼性またはパフォーマンスに影響を及ぼすリスクを持つ、サイズ不足の可能性があるワークロードのシグナルを確認できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_GKE_workload.max-800x800.jpg

しかし、これらのアプリケーションのサイズを適切に適正化するというステップへ進めることは、特に規模が大きい場合には簡単ではありませんでした。この課題も、GKE の新しいサイズ適正化機能を使えば解決できます。

まず、最適化するワークロードを選びます。通常は、リソースリクエストの量および上限と、実際の使用量との差が大きいものが候補として適しています。GKE ワークロードコンソールの [費用の最適化] タブで、明るい緑色が多く表示されているワークロードがこれに該当します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_GKE_workload.max-800x800.jpg

ワークロードを選んだら、ワークロードの詳細に移動して [アクション] => [スケール] => [リソースリクエストを編集] を選択し、詳細な最適化手順のガイドを確認します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_GKE_workload.max-800x800.jpg

表示されるガイドの内容は、新しい「推奨されるレプリカあたりのリクエストコア数」と「推奨されるレプリカあたりのリクエストバイト数」の指標（Cloud Monitoring で確認できるものと同じ指標）によって大きく変わります。これらの指標はいずれも実際のワークロード使用量に基づいています。対象の GKE デプロイメントごとにこのビューにアクセスでき、ご自身で何かを構成する必要はありません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/5_GKE_workload.max-1500x1500.jpg

対象のデプロイメントに最適な値を確認したら、GKE コンソールでリソースリクエストの量と上限を直接編集できます。編集内容はワークロードに直接適用されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/6_GKE_workload.max-1300x1300.jpg

注: 提案内容はワークロードの実測使用パターンに基づいたもので、ご自身のアプリケーションに最適ではない可能性があります。また、それぞれのケースで特殊なケースや固有のニーズがある可能性もあります。総合的なチェックを行って、固有のワークロードに最適な値を把握することをおすすめします。

注: Java ワークロードによるメモリの使用状況は可視性が制限されているため、JVM ベースのワークロードではメモリに関する推奨事項はサポートされていません。

必要に応じてリソースリクエストの量と上限を GKE コンソール以外で設定する場合は、推奨される設定の YAML ファイルを生成してデプロイメントの構成に使用することもできます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/7_GKE_workload.max-1300x1300.jpg

注: 水平 Pod 自動スケーリング（HPA）が有効になっているワークロードでは、HPA が構成されている指標と同じ指標の推奨値は提案されません。たとえば、ワークロードで CPU 向けの HPA が構成されている場合、メモリに関する提案のみが表示されます。

特定のワークロードの適格性および HPA などの他のスケーリングメカニズムとの互換性について詳しくは、機能に関するこちらのドキュメントをご確認ください。

GKE Autopilot とワークロードのサイズ適正化で効率性をレベルアップ

GKE Autopilot が GKE における重要な費用最適化メカニズムであることについては、これまでに何度もお伝えしてきました。GKE Autopilot は、ノードプールや VM 単位での最適化の必要性を排除するフルマネージドのインフラストラクチャツールです。そのため、稼働中の VM や、不要なリソースによる無駄、Day 2 運用の取り組みなどに関連するビンパッキング最適化の問題をなくすことができます。

GKE Autopilot では、リクエストしたリソースに対して課金されます。リソースリクエストの最適化が主な目的である、ワークロードのサイズ適正化と組み合わせることで、最適化の落とし穴になり得る 3 つの大きな問題のうち 2 つ（アプリのサイズ適正化とビンパッキング）に簡単に対処できるようになります。GKE Autopilot で対象ワークロードを実行してリソースリクエストを改善することで、すぐに直接的なプラスの影響が請求内容に現れてくるはずです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/8_GKE_workload.max-1300x1300.jpg

GKE 最適化に役立つサイズ適正化指標などのリソース

この新たな最適化ワークフローをサポートするために、「推奨されるレプリカあたりのリクエストコア数」と「推奨されるレプリカあたりのリクエストバイト数」という新しい指標もリリースしました。いずれも、Cloud Monitoring の Kubernetes スケーリング指標グループ（[Kubernetes Scale] => [Autoscaler] => [Recommended per replica request]）でご確認いただけます。これらの指標を活用して、独自のカスタムビューやランキングビューなどのエクスペリエンスを構築したり、最新の最適化機会をエクスポートしたりすることもできます。