NVIDIA RTX PRO 6000 Blackwell を搭載した新しい G4 VM が AI、グラフィック、ゲームなどを強化
Nirav Mehta
VP, Google Cloud Compute Platform
Roy Kim
Director, Google Cloud AI Infrastructure
※この投稿は米国時間 2025 年 6 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
このたび、業界初となる、NVIDIA RTX PRO 6000 Blackwell Server エディションをベースとする新しい G4 VM のプレビュー版をリリースしましたのでお知らせいたします。これは、今年に入ってリリースされた、大規模な AI トレーニング / サービング向けに設計された NVIDIA Blackwell GPU 搭載の A4 および A4X VM に続くものです。同時に、さまざまなワークロードやデータ形式に対応する GPU の需要も高まっている事も確認されています。G4 VM は、第 4 世代の NVIDIA GPU ポートフォリオを完成させ、企業やクリエイターに新たなレベルのパフォーマンスと柔軟性をもたらします。
G4 VM は、8 個の NVIDIA RTX PRO 6000 GPU、2 個の AMD Turin CPU、Google Titanium オフロードを組み合わせたものです。
-
RTX PRO 6000 Blackwell GPU は、新しい第 5 世代 Tensor コア、FP6 と FP4 の精度をサポートする第 2 世代 Transformer Engine、第 4 世代 Ray Tracing(RT)コア、マルチインスタンス GPU(MIG)機能を備えており、G2 VM と比較して 4 倍のコンピューティングとメモリ、6 倍のメモリ帯域幅を実現します。
-
Turin CPU は、最大 384 個の vCPU と 1.4 TB の DDR5 メモリを備えており、GPU あたり 48 個の vCPU の比率を実現します。これは、CPU とグラフィックで事前計算の特徴を持つエンベディング モデルを実現し、これによって CPU はシミュレーションのオーケストレーショを支援します。
-
また、Titanium オフロードにより専用のネットワーク処理が可能になり、最大 400 Gbps の帯域幅、つまり G2 VM の 4 倍の速度が実現します。
G4 VM は、費用効率の高い推論から、高度な物理 AI、ロボット シミュレーション、生成 AI を活用したコンテンツ制作、次世代ゲーム レンダリングまで、さまざまなワークロードに対応できます。たとえば、光の物理的な動作をシミュレートする高度なレイ トレーシング コアを備えた NVIDIA RTX PRO 6000 Blackwell は、前世代の 2 倍以上のパフォーマンスを発揮し、超リアルなグラフィックによって複雑なリアルタイム レンダリングを実現します。要求の厳しいグラフィックス アプリケーションや物理 AI 対応アプリケーションの場合、NVIDIA Omniverse ワークロードをネイティブに実行できれば、デジタルツインやリアルタイム シミュレーションによって業務が急速に変化している製造、自動車、物流業界において新たな可能性がもたらされます。G4 VM は NVIDIA Dynamo 推論フレームワークもサポートしており、生成モデルに対して高スループットかつ低レイテンシの AI 推論を大規模に行えます。
メディア、エンターテイメントから製造、自動車、ゲームまで、さまざまな業界のお客様が、AI を活用したコンテンツ制作、高度なシミュレーション、高性能な可視化を加速させるために G4 VM を利用し始めています。
「G4 VM の初期テストでは、特にセルフホスト型 LLM 推論ユースケースで大きな可能性が示されました。今後、他のさまざまなランキング ワークロードで G4 VM のベンチマークを実施する予定です。」- Snap、ソフトウェア エンジニアリング担当シニア マネージャー、Vinay Kola 氏
-
Altair は、Google Cloud の G4 インスタンスのパフォーマンスと大容量メモリを活用して、顧客のコンピュータ支援エンジニアリング(CAE)ワークロードを加速させる予定です。
-
Ansys は、Google Cloud の G4 インスタンスを活用してシミュレーション ワークロードを高速化できるよう、顧客を支援する予定です。
-
AppLovin は、広告配信とレコメンデーションに G4 を活用しています。
-
WPP は、G4 を活用して、物理的に正確な生成 AI とロボット シミュレーションによる画期的な取り組みを継続しています。
-
Nuro は、NVIDIA Omniverse を介して G4 でドライブ シミュレーションを行うことを検討しています。
-
ビデオゲーム業界の大手企業が、次世代のゲーム レンダリングに G4 の使用を検討しています。
G4 VM は、768 GB の GDDR7 メモリと 384 個の vCPU を備えており、12 TiB の Titanium ローカル SSD を搭載しています。また、最大 512 TiB の Hyperdisk ネットワーク ブロック ストレージに拡張可能です。設計およびシミュレーション ワークロードについては、G4 VM は、Altair HyperWorks、Ansys Fluent、Autodesk AutoCAD、Blender、Dassault SolidWorks、Unity など、サードパーティのエンジニアリング アプリケーションとグラフィック アプリケーションに対応します。
G4 VM は、Google Cloud の完全統合型 AI スーパーコンピューティング システムである AI Hypercomputer の一部として利用でき、Google Kubernetes Engine、Google Cloud Storage、Vertex AI などの Google Cloud サービスとネイティブに連携します。多くのお客様は、Vertex AI や GKE などのサービスを、Google Compute Engine 上の NVIDIA GPU および Google Cloud HyperdiskML と組み合わせ、AI 推論に使用しています。Hyperdisk は超低レイテンシを実現しており、インスタンスあたり最大 50 万 IOPS と 1 万 MiB/秒のスループットに対応しているため、要求の厳しい推論ワークロードに適しています。
G4 は現在プレビュー版で提供されており、年末までに全世界で利用可能になる予定です。詳細については、Google Cloud の営業担当者にお問い合わせください。
-Google Cloud コンピューティング プラットフォーム担当バイス プレジデント、Nirav Mehta
-Google Cloud AI Infrastructure 担当ディレクター、Roy Kim