コンピューティング

Dynamic Workload Scheduler のカレンダーモードについて: ML GPU と TPU を予約する

2025年8月5日

Ari Liberman

Group Product Manager

Shamel Jacobs

Product Manager

Try Gemini 3.1 Pro

Our most intelligent model available yet for complex tasks on Gemini Enterprise and Vertex AI

Try now

※この投稿は米国時間 2025 年 7 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

組織には、突発的なピークや周期的な低負荷期にも対応できる ML コンピューティングリソースが必要です。つまり、AI インフラストラクチャの利用モデルは、コスト効率を高め、契約期間に柔軟性を持たせ、最新の GPU および TPU アクセラレータを活用した迅速な開発を支援する方向へ進化する必要があります。

カレンダーモードは、Dynamic Workload Scheduler の最新機能として、現在プレビュー版で利用可能です。このモードは、長期契約を必要とせず、最大 90 日間の予約済み ML 容量を短期間利用できる機能です。

カレンダーモードは、Compute Engine の将来の予約機能を拡張し、モデルのトレーニング、ファインチューニング、試験運用、推論のワークロードに適した、同一ロケーションの GPU と TPU 容量を提供します。

フライトやホテルの予約と同様に、カレンダーモードでは ML 容量を簡単に検索して予約できます。リソースタイプ、インスタンス数、予想開始日と期間を指定するだけで、数秒以内に利用可能な容量を確認して予約できます。容量の予約が確定してプロジェクトに割り当てられると、Compute Engine、Google Kubernetes Engine（GKE）、Vertex AI カスタムトレーニング、Google Batch から利用可能になります。

お客様の声

過去 1 年間、早期アクセスのお客様はカレンダーモードを活用し、創薬から新しいモデルのトレーニングまで、さまざまな用途で ML コンピューティングリソースを予約してきました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1-Schrodinger.max-700x700.jpg

「創薬の加速に向けて、Schrödinger は大規模なシミュレーションを活用し、有望で高品質な分子を特定しています。Google Cloud の DWS カレンダーモードで GPU を予約することで、重要かつ時間的制約のあるプロジェクトに対し、コスト効率の高い方法でコンピューティング環境を柔軟にスケーリングできるという安心感を得ています。」- Schrödinger、EVP/CIO、Shane Brauner 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/2-Vilya.max-700x700.jpg

「Vilya では、Dynamic Workload Scheduler により、コスト効率とパフォーマンスという 2 つの重要な側面で成果を上げました。コスト効率の向上は大きなメリットであり、GPU への安定したアクセスによってチームはプロジェクトをより迅速に完了できるようになりました。これは、計算負荷の高いタスクにとって非常に貴重な支援となっています。予算を超えることなく、効率性と生産性を向上させることができました。」- 共同創業者兼 CTO、Patrick Salveson 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/3-Databricks.max-700x700.jpg

「Databricks は、ML モデルの導入と管理を簡素化し、スケーラブルな本番環境でのファインチューニングやリアルタイム推論を可能にします。DWS カレンダーモードにより、GPU 容量計画の負担が軽減され、テストや継続的なトレーニングといった変動する需要にも対応し、最新世代の GPU ハードウェアにシームレスにアクセスできるようになりました。」- サーバーレスプラットフォーム担当シニアディレクター、Ravi Gadde 氏

カレンダーモードの使用

これらのコンセプトとユースケースを理解したところで、次は Google Cloud コンソールで容量を検索して予約する方法を見ていきましょう。Cloud コンソールの [Compute Engine] -> [予約] に移動します。次に、[将来の予約] タブで [将来の予約の作成] をクリックします。サポートされている GPU または TPU を選択すると、以下に示すとおり [容量を検索] セクションが表示されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4-CreationUI.max-1500x1500.png

[詳細設定] をクリックし、予約を複数のプロジェクトで共有するかどうかを設定します。最後に予約を作成して名前を付けます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/5-SubmissionUI.max-1500x1500.png

https://storage.googleapis.com/gweb-cloudblog-publish/images/6_xc1KvuF.max-900x900.jpg

予約は数分以内に承認されます。指定された開始時刻にステータスが [完了] になると、その容量を使用できます。

使ってみる

AI Hypercomputer でカレンダーモードを使うと、ML ワークロードの容量の検索、予約、使用、管理が簡単になります。TPU のカレンダーモードを今すぐご利用ください。Compute Engine、GKE、または Slurm での GPU アクセスについては、アカウント担当者にお問い合わせください。詳しくは、カレンダーモードのドキュメントと Dynamic Workload Scheduler の料金をご覧ください。

-グループプロダクトマネージャー、Ari Liberman

-プロダクトマネージャー、Shamel Jacobs

投稿先