コンテンツに移動
コンピューティング

フォールト トレラントなワークロードを高い費用対効果で実行する Google Cloud Spot VM の一般提供を開始

2022年5月31日
https://storage.googleapis.com/gweb-cloudblog-publish/images/05_-_Compute.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2022 年 5 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

本日から一般提供が始まったことにより、今すぐ Spot VM を Google Cloud プロジェクトにデプロイして節約を始めていただくことができます。Spot VM の概要はプレビュー版リリースのブログ、詳しい説明は Spot VM のドキュメントをご確認ください。

マイクロサービス、コンテナ化されたワークロード、水平方向にスケーラブルなアプリケーションといった最新のアプリケーションは、基盤となるマシンが永続的でなくても永続するように設計されています。このアーキテクチャにより、Spot VM を利用して処理能力を有効活用し、低価格でアプリケーションを実行することが可能になっています。Spot VM を使用することで、オンデマンド VM の料金を 60~91% 削減できます。

また、Spot VM をさらに簡単に利用できるよう、さまざまなツールに Spot VM のサポートを組み込みました。

Google Kubernetes Engine(GKE)

コンテナ化されたワークロードは一般にステートレスでフォールト トレラントのため、多くは Spot VM に適しています。Google Kubernetes Engine(GKE)はコンテナ オーケストレーションを提供します。今回 Spot VM がネイティブにサポートされたことにより、GKE を使用して Spot VM を管理し、コストの節約を実現できるようになります。GKE バージョン 1.20 以降を実行しているクラスタでは、kubelet グレースフル ノード シャットダウン機能がデフォルトで有効になっています。これにより kubelet がプリエンプション通知を認識し、ノードで実行中の Pod を正常に終了させるとともに、Spot VM を再起動し、Pod のスケジュールを変更します。今回のリリースにより、GKE の Spot VM サポートが一般提供となりました。

GKE と Spot VM に関するベスト プラクティスについては、コストを最適化した Spot VM でのウェブ アプリケーション実行に関するアーキテクチャ チュートリアルのほか、GKE Spot VM のドキュメントをご覧ください。

GKE Autopilot Spot Pod

Kubernetes は、パワフルで柔軟な構成が可能なシステムです。とはいえ、それほどの制御や選択肢が常に必要なわけではありません。GKE Autopilot は、業界のベスト プラクティスを自動的に適用し、ノード管理作業の負担を最小限に抑える新しい GKE 使用モードを提供します。GKE Autopilot を使用すると、ワークロードのニーズに応じて処理性能が自動的に調整および最適化されます。Spot Pod を併用すれば、効率性がさらに高まり、ノードのコストが大幅に削減されます。GKE Autopilot は、Spot Pod がプリエンプトされたノードからリクエストをリダイレクトすることでスムーズにプリエンプション イベントを処理するとともに、自動スケーリングとスケジュールの管理によって新しい置換ノードを作成し、十分なリソースが維持されるようにします。

GKE Autopilot 用 Spot Pod は一般提供を開始しました。詳細は、GKE AutopilotSpot Pod のドキュメントをご覧ください。

Terraform

Terraform はコードとしてのインフラストラクチャ管理を容易にします。Google Cloud での Terraform における Spot VM のサポートがこのたび開始されました。Terraform テンプレートを使用し、ネットワーキング、ディスク、サービス アカウントなどの Spot VM を使用する環境全体を定義することにより、デプロイメントの継続的な立ち上げと破棄が簡便で再現可能な作業になります。Spot VM を使用する際はリソースをエフェメラルとして扱う必要があるため、Terraform が特に重要となります。

Terraform は、GKE と併用し、クラスタ コントロール プレーンとは別にノードプールを定義および管理する際にさらに効果を発揮します。Terraform でコンピューティング リソースを設定し、GKE で自動スケーリングと自動修復を実行すれば、プリエンプションの後に十分な VM を確保でき、両方の利点を得られます。

Slurm

Slurm は、TOP500 に名を連ねる世界中のスーパー コンピュータで使用されている主要なオープンソース HPC ワークロード マネージャーです。過去 4 年間、Google は進歩し続ける Slurm の最新版を Google Cloud でリリースするため、Slurm を推進する企業である SchedMD と協力してきました。SchedMD はこのほど Google Cloud スクリプトに対応する最新の Slurm をリリースしました。これは Google Cloud Marketplace および SchedMD の GitHub リポジトリで提供されています。この Google Cloud 向け Slurm の最新バージョンには、Bulk API を介した Spot VM のサポートが含まれます。リリースの詳細は、Google Cloud ブログ投稿をご覧ください。


- プロダクト マネージャー Jin Su
投稿先