コンテンツに移動
コンピューティング

H4D VM: 次世代の HPC 最適化 VM

2025年4月25日
https://storage.googleapis.com/gweb-cloudblog-publish/images/H4D_VMs_optimized_for_HPC.max-2600x2600.jpg
Aysha Keen

Product Manager

Felix Schürmann

Senior HPC Technologist

※この投稿は米国時間 2025 年 4 月 11 日に、Google Cloud blog に投稿されたものの抄訳です。

Google は、Google Cloud Next で、ハイ パフォーマンス コンピューティング(HPC)向けの最新のマシンタイプである H4D VM を発表しました。H4D VM は、既存の HPC サービスを基盤として、製造、天気予報、EDA、医療、ライフ サイエンスなどの業界における、要求の厳しいワークロードに対して進化するニーズに対応するように設計されています。

H4D VM は 第 5 世代 AMD EPYCTM プロセッサを搭載しており、ノード全体の VM パフォーマンスは 12,000 GFLOPS 以上、メモリ帯域幅は 950 GB/s 以上と向上していますH4D は、Titanium 上で Cloud リモート ダイレクト メモリ アクセス(RDMA)を使用して低レイテンシと 200 Gbps のネットワーク帯域幅を実現する、Google 初の CPU ベースの VM です。この強力な組み合わせにより、HPC ワークロードを効率的にスケールし、より迅速に分析情報を取得できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_H4D_Performance_Overview_70YwFM8.max-280.max-1900x1900.jpg

世代間の改善率を示す、H4D と C2D / C3D の VM とコアのパフォーマンス、メモリ帯域幅の比較

スーパーコンピュータの浮動小数点演算能力を測定するために広く使用されているベンチマークであるオープンソースの High-Performance Linpack(OSS-HPL)において、H4D は C3D と比較して VM あたり 1.8 倍、コアあたり 1.6 倍のパフォーマンスを実現します。さらに、H4D は C2D と比較して、VM あたりのパフォーマンスが 5.8 倍、コアあたりのパフォーマンスが 1.7 倍向上しています。

メモリ帯域幅を測定するベンチマークである STREAM Triad では、H4D は C3D と比較して VM あたりのパフォーマンスが 1.3 倍、コアあたりのパフォーマンスが 1.4 倍向上しています。さらに、H4D は C2D と比較して、VM あたりのパフォーマンスが 3 倍、コアあたりのパフォーマンスが 1.4 倍向上しています。

HPC アプリケーションのパフォーマンスの向上

H4D VM は、C2D や C3D などの前世代の AMD ベースの VM を大幅に上回るコンピューティング性能とメモリ帯域幅を実現し、シミュレーションと分析の高速化を可能にします。また、以下に示したさまざまな HPC アプリケーションやベンチマークでパフォーマンスを大幅に向上させます(前世代の AMD ベースの HPC VM、C2D との比較)。

  • 製造

    • SiemensTM Simcenter STAR-CCM+TM/HIMach などの CFD アプリでは、最大 3.6 倍 の改善が見られます。

    • Ansys Fluent/f1_racecar_140 などの CFD アプリでは、最大 3.6 倍の改善が見られます。

    • Altair Radioss/T10m などの陽解法 FEA アプリでは、最大 3.6 倍の改善が見られます。

    • OpenFoam/Motorbike_20m などの CFD アプリでは、最大 2.9 倍の改善が見られます。

    • Ansys Mechanical/gearbox などの陰解法 FEA アプリでは、最大 2.7 倍の改善が見られます。

  • 医療、ライフ サイエンス

    • 分子動力学(GROMACS)では最大 5 倍の改善が見られます。

  • 天気予報

業界標準のベンチマーク WRFv4 では、最大 3.6 倍の改善が見られます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_H4D_Performance_Overview__0J9kfD9.max-2200x2200.jpg

図 2: C2D に対する H4D、C3D、C2D の単一 VM HPC アプリケーションのパフォーマンス(高速化)アプリケーションは、すべてのコアを使用して単一の VM で実行されました。

「Google Cloud との緊密な連携により、次世代のクラウドベース HPC が実現し、新しい H4D VM の発表にいたりました。Google Cloud は、第 5 世代の AMD EPYC CPU の進化したアーキテクチャを活用し、前世代と比較してさまざまな HPC ベンチマークで大幅なパフォーマンス向上を実現するサービスを構築しました。これにより、お客様は迅速に分析情報を取得し、最も要求の厳しい HPC ワークロードを高速化できます。」- AMD、クラウド ビジネス担当コーポレート バイス プレジデント、Ram Peddibhotla 氏

Titanium 上の Cloud RDMA による HPC の高速化

H4D のパフォーマンスは、Cloud RDMA によって実現されます。これらの VM で初めて利用可能となった新しい Titanium オフロードが Cloud RDMA です。Cloud RDMA は、計算流体力学、気象モデリング、分子動力学など、ノード間通信に大きく依存する HPC ワークロードをサポートするように特別に設計されています。ネットワーク処理をオフロードすることで、予測可能な低レイテンシの高帯域幅の通信をコンピューティング ノード間で提供し、ホスト CPU のボトルネックを最小限に抑えます。

Cloud RDMA は、イーサネット ベースのデータセンター ネットワークを介した信頼性の高い低レイテンシの通信のために、Google の革新的な Falcon ハードウェア トランスポートを使用しています。これにより、イーサネット経由の RDMA の従来の課題を効果的に解決し、予測可能な大規模な高パフォーマンスを実現します。

Falcon 経由の Cloud RDMA は、より多くのコンピューティング リソースを効率的に利用することで、シミュレーションを高速化します。たとえば、並列処理に基本的な制限があり、一般に高速化が困難な OpenFoam/motorbike_20m や Simcenter Star-CCM+/HIMach10 のような小規模な CFD 問題では、H4D は 4 台の VM で TCP と比較してそれぞれ 3.4 倍、1.9 倍の高速化を実現します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_H4D_Performance_Overview_ACW0JRf.max-280.max-1500x1500.jpg

図 3: 左: OpenFoam/Motorbike_20m は、4 台の VM で TCP 上の H4D Cloud RDMA を使用して 3.4 倍の改善を実現。右: Simcenter STAR-CCM+/HIMach10 は、4 台の VM で TCP 上の H4D Cloud RDMA を使用して 1.9 倍の改善を実現。

大規模なモデルの場合、Falcon は強力なスケーリングの維持にも役立ちます。32 台の VM を使用して、Falcon は GROMACS/Lignocellulose では TCP 上で 2.8 倍、WRFv4/Conus 2.5km では 1.3 倍の高速化を達成しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_H4D_Performance_Overview_xD2Vaok.max-280.max-1500x1500.jpg

図 4: 左: GROMACS/Lignocellulose は、32 台の VM で TCP 上の H4D Cloud RDMA を使用して 2.8 倍の改善を実現。右: WRFv4/Conus 2.5km は、32 台の VM で TCP 上の H4D Cloud RDMA を使用して、1.3 倍の改善を実現。

クラスタ管理とスケジューリング機能

H4D VM は、Dynamic Workload Scheduler(DWS)と Cluster Director(旧称 Hypercompute Cluster)の両方をサポートします。

DWS は、HPC ワークロードをスケジュールして最適なパフォーマンスと費用対効果を実現し、時間的制約のあるシミュレーションと柔軟な HPC ジョブのリソースの可用性を高めます。

物理的に同じ場所に配置された大規模なアクセラレータ クラスタを単一のユニットとしてデプロイしてスケールできる Cluster Director の機能が HPC 環境に拡張されました。Cluster Director を使用すると、研究者は大規模なシミュレーションを簡単に設定して実行できるため、H4D VM 上の複雑な HPC クラスタのデプロイと管理が簡素化されます。

VM サイズとリージョンの可用性

H4D VM は、標準構成と高メモリ構成の両方で提供され、多様なワークロードの要件に対応できます。また、CPU ベースの地震処理や構造力学のアプリケーション(例: Abaqus、NASTRAN、Altair OptiStruct、Ansys Mechanical)のように高速ストレージが求められるワークロード用にローカル SSD を使用したオプションも用意しています。

VM

コア数

メモリ

ローカル SSD

h4d-highmem-192-lssd

192

1488

3.75 TB

h4d-standard-192

192

720

なし

h4d-highmem-192

192

1488

なし

H4D VM は現在、us-central1-a(アイオワ)と europe-west4-b(オランダ)でご利用いただけます(他のリージョンでも提供予定)。

お客様とパートナー様の声

https://storage.googleapis.com/gweb-cloudblog-publish/images/harvard.max-700x700.jpg

「Google の新しい H4D ベースのクラスタの機能により、1 兆個に近い粒子のシステムをシミュレートする態勢が整い、循環機能や循環器疾患に関する前例のない分析情報を引き出せるようになります。このコンピューティング能力の飛躍的な向上により、画期的な治療法の確立に向けた取り組みが劇的に加速し、心臓病における血管損傷への効果的な精密治療へさらに近づくことができるでしょう。」- ハーバード大学、科学技術コンピューティング分野教授、Petros Koumoutsakos 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/ansys_yPNqr91.max-700x700.jpg

「Google Cloud の H4D プラットフォームのリリースにより、エンジニアリング シミュレーションは大きく前進しました。GCP 初のイーサネット経由の RDMA を搭載した VM であり、より高いメモリ帯域幅、大容量の L3 キャッシュ、AVX-512 命令のサポートを組み合わせることで、H4D は C2D VM と比較して、Ansys Fluent シミュレーションのパフォーマンスが最大 3.6 倍向上します。このパフォーマンスの向上により、お客様はシミュレーションをより高速に実行し、幅広い設計オプションを検討して、効率的にイノベーションを推進できるようになります。」- Ansys、パートナー プログラム担当シニア ディレクター Wim Slagter 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/Altair.max-700x700.jpg

「第 5 世代 AMD EPYC™ を搭載した Google H4D VM の、前世代と比べたパフォーマンス向上は実に驚くべきものです。Altair® Radioss® は、自動車事故の分析など、コンピューティング負荷が高く、高度に非線形なシミュレーションにおいて、驚異的な 3.6 倍の高速化を実現します。この飛躍的な進歩により、デジタル スレッドの時代においてお客様にとって不可欠なより高速かつ高精度のシミュレーションが可能になります。」- Radioss Development and Altair Solvers HPC、シニア バイス プレジデント、Eric Lequiniou 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/siemens.max-700x700.jpg

「第 5 世代 AMD EPYC プロセッサと Cloud RDMA を搭載した最新の H4D VM を使うことで、お客様は Simcenter STAR-CCM+ のシミュレーション時間を短縮できます。HIMach10 では、C2D インスタンスと比較して最大 3.6 倍のパフォーマンス向上が見られ、4 台の H4D Cloud RDMA VM では TCP と比較して 1.9 倍の高速化が実現しています。Google とのパートナーシップは、シミュレーション時間を短縮するうえで不可欠でした。」- Siemens、Simcenter ソリューション ドメイン プロダクト マネジメント担当バイス プレジデント、Lisa Mesaros 氏

試してみる

HPC ワークロードでより迅速に結果を得られるよう、お客様が H4D VM をご活用くださることを楽しみにしています。こちらのフォームに記入してプレビュー版にお申し込みください。

-プロダクト マネージャー、Aysha Keen 
-シニア HPC テクノロジスト、Felix Schürmann

 

投稿先