Google Cloud Next Tokyo：7/30、31 東京ビッグサイトにて開催！

Google Cloud Managed Lustre

高性能の並列ファイルシステム

Google の最高パフォーマンスの POSIX 準拠並列ファイルシステムを使用して、HPC と AI のトレーニングとサービス提供を加速します。

機能

AI 導入の加速

次世代の AI の要求に対応できるよう、スケールを 10 倍に拡大しています。Managed Lustre のパフォーマンスを 10 TB/秒に向上させることで、大規模な AI/ML ワークロードへの道を開き、トレーニングと推論の両方のパイプラインを大幅に高速化しました。

ダイナミックティア

柔軟性を最大限に高めるため、新しい動的オプションでは、重要なデータに対して最高のパフォーマンスを発揮しつつ、データセット全体における総費用を削減します。単一の SKU に統合することで、正確な費用を事前に把握できる、予測可能な課金体系を実現します。すべてのデータが Lustre 内に存在するため、ホットデータでは超低レイテンシを、コールドデータではブロック並みのレイテンシを実現できます。これにより、データセット全体を Managed Lustre に移行する際に、モデルの読み込み、トレーニング、高頻度のチェックポイント処理におけるボトルネックを解消できます。

GPU の飽和度とコンピューティングの ROI を最大化

AI の真のコストは単なるストレージではありません。それはアイドル状態のコンピューティングにあります。Managed Lustre は、高価なアセットを最大限に活用するために必要な高スループット、低レイテンシのデータ配信を実現します。データ配信を最適化し、迅速なチェックポイント処理を加速することで、アクセラレータの使用率が大幅に向上し、オーバーヘッドが削減され、1 ドルあたりのパフォーマンスが向上します。

AI/ML ワークロードのためのパフォーマンスとスケーリング

大規模なディープラーニングモデルのトレーニングには、膨大なデータセットが必要です。DDN EXAScaler をベースとした Managed Lustre は、データアクセスを分散し、トレーニング時間を短縮して、より迅速な分析情報、より高い精度、複雑な AI プロジェクトの処理を可能にします。拡張性により、データ量の増加に対応してパフォーマンスを維持できるので、ストレージがボトルネックになるのを防止できます。Managed Lustre について概説した Omdia の動画をこちらでご覧いただけます。

Managed Lustre を活用し、組織でより多くのデータを保存することで AI プロジェクトをサポートする方法をご覧ください。

KV キャッシュで AI 推論を高速化

エージェント AI は引き続き大規模なコンテキストウィンドウを活用しており、エンドユーザーが LLM とやり取りする際に応答性の高いエクスペリエンスを提供するうえで、ストレージの課題が生じる可能性があります。コンテキストウィンドウが大きいと、アクセラレータのローカルメモリが枯渇しやすくなり、モデルが外部ストレージにアクセスする必要があるため、レイテンシの影響を受けやすくなります。

ブログ「Managed Lustre の外部 KV キャッシュで AI 推論を迅速化」を読む。

さまざまな業界でイノベーションを推進

業種
AI と ML ^{データ不足を解消し、基盤モデルを大規模にトレーニングできます。Managed Lustre はコンピューティングとストレージを分離することで、ミリ秒未満の外部 KV キャッシュ保存により、最も高価なアクセラレータを完全な飽和状態に保ち、LLM 推論のスループットを向上させています。} ^{Google Cloud での}^AI^{の詳細をご覧ください。}
医療とライフサイエンス ^{画期的なイノベーションの推進による新たな治療法の開発創薬の加速、複雑なゲノムシーケンスの分析、AI 主導の Medical Imaging Suite の強化に必要な極めて高い IOPS を実現し、研究者や臨床医が分析情報を得るまでの時間を大幅に短縮します。} ^{Google Cloud の}^{ヘルスケアとライフサイエンス業界向けソリューション}^{をご覧ください。}
マシンビジョン、ロボット工学、自律走行車 _{ソフトウェア定義車両のパイプラインを加速します。イノベーターがペタバイト規模のセンサーテレメトリーを簡単に取り込めるようにする一方で、空気力学、安全、熱最適化のシミュレーションのためのゼロレイテンシストレージで研究開発エンジニアリングを強化します。} ^{Google Cloud の}^自動車^{業界向けソリューションの詳細をご確認ください。}
証券取引所 _{ミリ秒未満の適合率が求められるワークロードを実行します。金融サービス向けの複雑な定量的リスク分析やリアルタイムの市場シミュレーションの実行、グローバルメディアスタジオ向けの高解像度 VFX レンダリングやポストプロダクションのワークフローの高速化など。} ^{Google Cloud の}^資本市場^と^{金融サービス}^{向けソリューションをご覧ください。}
メディアとエンターテイメント _{妥協のないストレージパフォーマンスで、制作の締め切りを遵守しましょう。シームレスな高解像度動画編集、リアルタイムの VFX レンダリング、ポストプロダクションワークフローの高速化に必要な非常に高いスループットをスタジオで実現できます。} ^{Google Cloud の}^{メディアとエンターテイメント}^{業界向けソリューションをご覧ください。}

AI と ML

^{データ不足を解消し、基盤モデルを大規模にトレーニングできます。Managed Lustre はコンピューティングとストレージを分離することで、ミリ秒未満の外部 KV キャッシュ保存により、最も高価なアクセラレータを完全な飽和状態に保ち、LLM 推論のスループットを向上させています。}

^{Google Cloud での}^AI^{の詳細をご覧ください。}

医療とライフサイエンス

^{画期的なイノベーションの推進による新たな治療法の開発創薬の加速、複雑なゲノムシーケンスの分析、AI 主導の Medical Imaging Suite の強化に必要な極めて高い IOPS を実現し、研究者や臨床医が分析情報を得るまでの時間を大幅に短縮します。}

^{Google Cloud の}^{ヘルスケアとライフサイエンス業界向けソリューション}^{をご覧ください。}

マシンビジョン、ロボット工学、自律走行車

_{ソフトウェア定義車両のパイプラインを加速します。イノベーターがペタバイト規模のセンサーテレメトリーを簡単に取り込めるようにする一方で、空気力学、安全、熱最適化のシミュレーションのためのゼロレイテンシストレージで研究開発エンジニアリングを強化します。}

^{Google Cloud の}^自動車^{業界向けソリューションの詳細をご確認ください。}

証券取引所

_{ミリ秒未満の適合率が求められるワークロードを実行します。金融サービス向けの複雑な定量的リスク分析やリアルタイムの市場シミュレーションの実行、グローバルメディアスタジオ向けの高解像度 VFX レンダリングやポストプロダクションのワークフローの高速化など。}

^{Google Cloud の}^資本市場^と^{金融サービス}^{向けソリューションをご覧ください。}

メディアとエンターテイメント

_{妥協のないストレージパフォーマンスで、制作の締め切りを遵守しましょう。シームレスな高解像度動画編集、リアルタイムの VFX レンダリング、ポストプロダクションワークフローの高速化に必要な非常に高いスループットをスタジオで実現できます。}

^{Google Cloud の}^{メディアとエンターテイメント}^{業界向けソリューションをご覧ください。}

仕組み

AI 向けの高パフォーマンスストレージ。DDN EXAScaler を活用した Google Cloud Managed Lustre により、クラウド HPC のプロビジョニングやスケーリングをオンデマンドで即座に行うことができます。

一般的な使用例

使ってみる

Managed Lustre インスタンスの作成: 数回クリックするだけで Managed Lustre インスタンスをデプロイできます。
取り込みと接続: Google Cloud Storage から直接データを取得して、Managed Lustre ファイルシステムを簡単に更新できます。
大規模な処理: 大規模なデータセットを Vertex トレーニングクラスタ（VTC）または GKE に超低レイテンシでフィードします。
高速化: 高スループットのデータを次世代のハードウェアに直接提供し、GPU を最大限に活用します。

チュートリアル、クイックスタート、ラボ

Managed Lustre インスタンスの作成: 数回クリックするだけで Managed Lustre インスタンスをデプロイできます。
取り込みと接続: Google Cloud Storage から直接データを取得して、Managed Lustre ファイルシステムを簡単に更新できます。
大規模な処理: 大規模なデータセットを Vertex トレーニングクラスタ（VTC）または GKE に超低レイテンシでフィードします。
高速化: 高スループットのデータを次世代のハードウェアに直接提供し、GPU を最大限に活用します。

料金

Managed Lustre の料金	Managed Lustre の料金は、主にロケーションとサービスレベルに基づいています。
サービスレベル	料金
1 TiB あたり 1,000 MB/秒 _{スループットが重要な AI / ML トレーニングなどの高パフォーマンスワークロードに最適です。}	$0.60～（GiB 単位/月）
1 TiB あたり 500 MB/秒 _{高パフォーマンスのバランス型に最適: 大量のスループットを必要とするものの、価格とパフォーマンスのバランスを取ることがメリットにつながる、要求の厳しい AI / ML ワークロード、複雑な HPC アプリケーション、データ集約型の分析に最適です。}	$0.34～（GiB 単位/月）
1 TiB あたり 250 MB/秒 _{汎用 HPC とスループット重視の AI に最適: 幅広い HPC ワークロード、AI / ML 推論、データの前処理、従来の NFS よりも大幅に優れたパフォーマンスを必要とするアプリケーションに適しており、費用対効果の高い価格設定となっています。}	$0.21～（GiB 単位/月）
1 TiB あたり 125 MB/秒 _{並列アクセスが必要な容量重視のワークロードに最適: 大容量と並列ファイルシステムアクセスが重要なシナリオ向けに設計されています。入出力が制約になる並列タスクが少ない場合に適しています。}	$0.145～（GiB 単位/月）
25 MB/秒/TiB - 動的 _{ホットデータ用のブロックレベルのキャッシュによる動的なパフォーマンス。読み取りと書き込みが大規模なデータコーパスのサブセットに集中する、キャッシュ可能なワークロードに最適です。ホットデータとコールドデータに統合された名前空間を提供します。}	$0.06～（GiB 単位/月）

Google Cloud の料金を確認する。すべての料金の詳細を見る。

Managed Lustre の料金

Managed Lustre の料金は、主にロケーションとサービスレベルに基づいています。

1 TiB あたり 1,000 MB/秒

_{スループットが重要な AI / ML トレーニングなどの高パフォーマンスワークロードに最適です。}

料金

$0.60～（GiB 単位/月）

1 TiB あたり 500 MB/秒

_{高パフォーマンスのバランス型に最適: 大量のスループットを必要とするものの、価格とパフォーマンスのバランスを取ることがメリットにつながる、要求の厳しい AI / ML ワークロード、複雑な HPC アプリケーション、データ集約型の分析に最適です。}

料金

$0.34～（GiB 単位/月）

1 TiB あたり 250 MB/秒

_{汎用 HPC とスループット重視の AI に最適: 幅広い HPC ワークロード、AI / ML 推論、データの前処理、従来の NFS よりも大幅に優れたパフォーマンスを必要とするアプリケーションに適しており、費用対効果の高い価格設定となっています。}

料金

$0.21～（GiB 単位/月）

1 TiB あたり 125 MB/秒

_{並列アクセスが必要な容量重視のワークロードに最適: 大容量と並列ファイルシステムアクセスが重要なシナリオ向けに設計されています。入出力が制約になる並列タスクが少ない場合に適しています。}

料金

$0.145～（GiB 単位/月）

25 MB/秒/TiB - 動的

_{ホットデータ用のブロックレベルのキャッシュによる動的なパフォーマンス。読み取りと書き込みが大規模なデータコーパスのサブセットに集中する、キャッシュ可能なワークロードに最適です。ホットデータとコールドデータに統合された名前空間を提供します。}

料金

$0.06～（GiB 単位/月）

Google Cloud の料金を確認する。すべての料金の詳細を見る。

料金計算ツール

Google Cloud プロダクトの月額料金を見積もりましょう。

カスタムの見積もり

カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

概念実証を開始する

Managed Lustre を使ってみる

技術的な詳細を掘り下げる

Google Cloud の Managed Lustre の詳細を確認する

Vertex AI で AI アプリケーションの構築を開始する

Google の統合スーパーコンピューティングアーキテクチャである AI ハイパーコンピュータを探索する

ビジネスケース

Managed Lustre を使用しているお客様の事例

「企業がディープフェイクの音声、動画、画像を検出してブロックできるかどうかは、モデルの性能にかかっています。Managed Lustre は、動的なデータセットを使用したモデルのトレーニングを成功させるうえで不可欠です。GPU の性能を完全に引き出せているため、当社が評価した他のストレージソリューションよりも 6 倍高速です。」

同社の成功事例はこちらからご覧いただけます。

^{—Resemble AI、CEO、Zohaib Ahmed 氏}

「Managed Lustre を使用することで、他の Google Cloud ソリューションと比較して、AFEELA Intelligent Drive の AI モデルトレーニングを 3 倍にスケールできます。」

^{—ソニー・ホンダモビリティ株式会社、AI & データ分析プラットフォーム担当シニアマネージャー、片岡基氏}

「Managed Lustre を VTC（Vertex トレーニングクラスタ）と統合することで、Salesforce AI Research での典型的なオンボーディングのボトルネックが解消され、推論ワークロードを迅速に実行できるようになりました。この高スループット、低レイテンシのストレージにより、B200 GPU では完全に飽和状態が維持され、H200 と比較して大規模言語モデルの推論で大幅なパフォーマンスの向上を実現できます。お客様にとっては、以前のレイテンシよりはるかに低いレイテンシで複雑な推論を処理できる、より高速で応答性の高い AI エージェントに直結します。

^{— Salesforce、プリンシパルソフトウェアエンジニア、Lavanya Karanam 氏}

「Google Cloud に移行したことで、研究速度が抜本的に変わりました。私の仕事は、膨大なデータセットを用いた大規模なニューラルネットワークのトレーニングです。このデータセットには、クラスタチームがアップロードした Common Corpus の全データも含まれており、私もクラスタから直接アクセスできるようになっています。この完全なデータセットへのアクセスは、これ以外のインフラストラクチャでは、到底実現できなかったでしょう。マネージド Lustre のおかげで、以前はパイプラインのボトルネックとなっていたデータ取り込みが今では数秒で完了できるようになったほか、GPU を常に最大限活用して、キュー待ちの時間も大幅に短縮されました。その結果、私が行っているすべての実験で、分析情報が得られるまでの時間が大幅に短縮されました。」

^{— オールドドミニオン大学、バージニア州モデリング・分析・シミュレーションセンター（VMASC）、リサーチアシスタントプロフェッサー、Christopher J. Lynch 博士}

「Managed Lustre のおかげで、数学的推論モデルのトレーニングテストの実行中に発生する中断が少なくとも 50% 削減されたので、テストを 2 倍多く実行できるようになりました。このサービスを「ホット」チェックポイントのリージョンキャッシュとして統合したことで、起動の速度、信頼性、利便性が向上し、チェックポイントの永続化も実現できました。このワークフローでは、トレーニングジョブがチェックポイントを書き込み、後続の推論ジョブや新しいトレーニングジョブがオフラインシステムでそのチェックポイントを使用します。これにより、データ取得速度が最大 15 倍向上し、起動時間が 50% 以上短縮されます。Lustre は追加設定なしで信頼性の高いマウントファイルシステムとして使用でき、高いパフォーマンスを発揮するので、当社の研究チームは、より自力で新しいトレーニングテクノロジーのテストを行えるようになりました。これにより、他のストレージから同じデータを取得するよりも高いパフォーマンスを維持しながら、イテレーションサイクルを簡単に 2 倍に増やすことができます。」

^{—Harmonic、インフラストラクチャ責任者、Riley Patterson 氏}

Managed Lustre で GKE ワークロードをスケーリング

Google Kubernetes Engine（GKE）で Managed Lustre CSI ドライバを使用して、コンテナ化された AI、ML、HPC ワークロード向けに高性能ストレージをシームレスにプロビジョニングする方法を説明するガイド。ブログを読む

Managed Lustre で AI と HPC を高速化

Managed Lustre でハイパフォーマンスコンピューティングワークロード向けの並列ファイルシステムのデプロイを簡素化する方法の概要。ブログを読む

Managed Lustre を使用した外部 KV キャッシュ

Lustre を使用して大規模言語モデル（LLM）推論の KV キャッシュをオフロードし、TPU / GPU のメモリオーバーヘッドを削減する方法について詳しく説明します。ブログを読む

Google Cloud Managed Lustre

高性能の並列ファイルシステム

商品に関する情報

AI 導入の加速

ダイナミックティア

GPU の飽和度とコンピューティングの ROI を最大化

AI/ML ワークロードのためのパフォーマンスとスケーリング

KV キャッシュで AI 推論を高速化

AI 向けの高パフォーマンスストレージ。DDN EXAScaler を活用した Google Cloud Managed Lustre により、クラウド HPC のプロビジョニングやスケーリングをオンデマンドで即座に行うことができます。

使ってみる

チュートリアル、クイックスタート、ラボ

料金計算ツール

カスタムの見積もり

概念実証を開始する

Managed Lustre を使ってみる

技術的な詳細を掘り下げる

Google Cloud の Managed Lustre の詳細を確認する

Vertex AI で AI アプリケーションの構築を開始する

Google の統合スーパーコンピューティングアーキテクチャである AI ハイパーコンピュータを探索する

最新のリリースを見る:

Google Cloud Managed Lustre

高性能の並列ファイル システム

商品に関する情報

AI 導入の加速

ダイナミック ティア

GPU の飽和度とコンピューティングの ROI を最大化

AI/ML ワークロードのためのパフォーマンスとスケーリング

KV キャッシュで AI 推論を高速化

AI 向けの高パフォーマンス ストレージ。DDN EXAScaler を活用した Google Cloud Managed Lustre により、クラウド HPC のプロビジョニングやスケーリングをオンデマンドで即座に行うことができます。

使ってみる

チュートリアル、クイックスタート、ラボ

料金計算ツール

カスタムの見積もり

概念実証を開始する

Managed Lustre を使ってみる

技術的な詳細を掘り下げる

Google Cloud の Managed Lustre の詳細を確認する

Vertex AI で AI アプリケーションの構築を開始する

Google の統合スーパーコンピューティング アーキテクチャである AI ハイパーコンピュータを探索する

最新のリリースを見る:

高性能の並列ファイルシステム

ダイナミックティア

AI 向けの高パフォーマンスストレージ。DDN EXAScaler を活用した Google Cloud Managed Lustre により、クラウド HPC のプロビジョニングやスケーリングをオンデマンドで即座に行うことができます。

Google の統合スーパーコンピューティングアーキテクチャである AI ハイパーコンピュータを探索する