コンテンツに移動
コンピューティング

Dynamic Workload Scheduler のカレンダー モードについて: ML GPU と TPU を予約する

2025年8月5日
Ari Liberman

Group Product Manager

Shamel Jacobs

Product Manager

Try Gemini 2.5

Our most intelligent model is now available on Vertex AI

Try now

※この投稿は米国時間 2025 年 7 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

組織には、突発的なピークや周期的な低負荷期にも対応できる ML コンピューティング リソースが必要です。つまり、AI インフラストラクチャの利用モデルは、コスト効率を高め、契約期間に柔軟性を持たせ、最新の GPU および TPU アクセラレータを活用した迅速な開発を支援する方向へ進化する必要があります。

カレンダー モードは、Dynamic Workload Scheduler の最新機能として、現在プレビュー版で利用可能です。このモードは、長期契約を必要とせず、最大 90 日間の予約済み ML 容量を短期間利用できる機能です。

カレンダー モードは、Compute Engine の将来の予約機能を拡張し、モデルのトレーニング、ファインチューニング、試験運用、推論のワークロードに適した、同一ロケーションの GPU と TPU 容量を提供します。

フライトやホテルの予約と同様に、カレンダー モードでは ML 容量を簡単に検索して予約できます。リソースタイプ、インスタンス数、予想開始日と期間を指定するだけで、数秒以内に利用可能な容量を確認して予約できます。容量の予約が確定してプロジェクトに割り当てられると、Compute Engine、Google Kubernetes Engine(GKE)、Vertex AI カスタム トレーニング、Google Batch から利用可能になります。

お客様の声

過去 1 年間、早期アクセスのお客様はカレンダー モードを活用し、創薬から新しいモデルのトレーニングまで、さまざまな用途で ML コンピューティング リソースを予約してきました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1-Schrodinger.max-700x700.jpg

「創薬の加速に向けて、Schrödinger は大規模なシミュレーションを活用し、有望で高品質な分子を特定しています。Google Cloud の DWS カレンダー モードで GPU を予約することで、重要かつ時間的制約のあるプロジェクトに対し、コスト効率の高い方法でコンピューティング環境を柔軟にスケーリングできるという安心感を得ています。」- Schrödinger、EVP/CIO、Shane Brauner 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/2-Vilya.max-700x700.jpg

「Vilya では、Dynamic Workload Scheduler により、コスト効率とパフォーマンスという 2 つの重要な側面で成果を上げました。コスト効率の向上は大きなメリットであり、GPU への安定したアクセスによってチームはプロジェクトをより迅速に完了できるようになりました。これは、計算負荷の高いタスクにとって非常に貴重な支援となっています。予算を超えることなく、効率性と生産性を向上させることができました。」- 共同創業者兼 CTO、Patrick Salveson 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/3-Databricks.max-700x700.jpg

「Databricks は、ML モデルの導入と管理を簡素化し、スケーラブルな本番環境でのファインチューニングやリアルタイム推論を可能にします。DWS カレンダー モードにより、GPU 容量計画の負担が軽減され、テストや継続的なトレーニングといった変動する需要にも対応し、最新世代の GPU ハードウェアにシームレスにアクセスできるようになりました。」- サーバーレス プラットフォーム担当シニア ディレクター、Ravi Gadde 氏

カレンダー モードの使用

これらのコンセプトとユースケースを理解したところで、次は Google Cloud コンソールで容量を検索して予約する方法を見ていきましょう。Cloud コンソールの [Compute Engine] -> [予約] に移動します。次に、[将来の予約] タブで [将来の予約の作成] をクリックします。サポートされている GPU または TPU を選択すると、以下に示すとおり [容量を検索] セクションが表示されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4-CreationUI.max-1500x1500.png

[詳細設定] をクリックし、予約を複数のプロジェクトで共有するかどうかを設定します。最後に予約を作成して名前を付けます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/5-SubmissionUI.max-1500x1500.png
https://storage.googleapis.com/gweb-cloudblog-publish/images/6_xc1KvuF.max-900x900.jpg

予約は数分以内に承認されます。指定された開始時刻にステータスが [完了] になると、その容量を使用できます。

使ってみる

AI Hypercomputer でカレンダー モードを使うと、ML ワークロードの容量の検索、予約、使用、管理が簡単になります。TPU のカレンダー モードを今すぐご利用ください。Compute Engine、GKE、または Slurm での GPU アクセスについては、アカウント担当者にお問い合わせください。詳しくは、カレンダー モードのドキュメントDynamic Workload Scheduler の料金をご覧ください。

-グループ プロダクト マネージャー、Ari Liberman

-プロダクト マネージャー、Shamel Jacobs

投稿先