コンテンツに移動
コンピューティング

ハイ パフォーマンス コンピューティング(HPC)用の H3 コンピューティング最適化 VM の紹介

2023年8月18日
Google Cloud Japan Team

※この投稿は米国時間 2023 年 8 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。

ハイ パフォーマンス コンピューティング(HPC)は、科学技術計算、エンジニアリング シミュレーション、気象モデリング、金融リスク分析、創薬などのさまざまな応用分野で発見の促進や製品の迅速な市場投入に役立ちます。HPC ユーザーは、より多くのシナリオを探索し、できるだけ短い時間で知見を得るために、必要なときに必要なコンピューティング リソースにアクセスできる Google Cloud をますます利用するようになっています。お客様のサポートをさらに強化し、ワークロードに最適化されたインフラストラクチャを提供するという取り組みを強化するため、Google は HPC に照準を合わせた H3 仮想マシンシリーズを新たにリリースしました。H3 シリーズは、Google 初の HPC ワークロード専用に設計されたマシンシリーズです。

Intel の第 4 世代 Xeon プラットフォーム(Sapphire Rapids)をベースとする H3 VM インスタンスは、これまで以上に高いパフォーマンスを低費用で HPC ユーザーに提供します。前世代の C2 インスタンス(Intel Cascade Lake をベースとする)と比較して、H3 はノードあたりのパフォーマンスが最大 3 倍向上し、マルチノード ワークロード向けのスケーラビリティが強化され、コスト パフォーマンスが最大 2 倍優れています。これらの改良により、HPC ユーザーは費用を削減しながら研究開発を加速することができます。H3 は現在 Compute Engine ユーザーと Google Kubernetes Engine(GKE)ユーザーに公開プレビュー版として提供されており、幅広い HPC ワークロードをサポートするために 88 個のコア(SMT は無効化されている)と 352 GB のメモリを備えています。

目的に特化した HPC VM マシンシリーズ

H3 は、HPC ユーザー向けの Google のプロダクト ポートフォリオを強化し、Intel の第 4 世代 Xeon プラットフォームの力を HPC ユースケースにまで拡大します。H3 マシンシリーズは、C2 VM と C2D VM を含むコンピューティング最適化マシン ファミリーの一部です。H3 は、Google の HPC 用に最適化されたインフラストラクチャ サービスを拡張し、コンピューティング、ネットワーキング、ストレージにおける最新のイノベーションを単一のプラットフォームに統合します。その結果、分子動力学、計算地球科学、天気予報、フロントエンドおよびバックエンド EDA、数値流体力学などの幅広い HPC ワークロードで高いパフォーマンスを発揮します。

H3 VM マシンシリーズのネットワーキングは、Google の第 3 世代 VM を支える Google のカスタム Intel Infrastructure Processing Unit(IPU)を基盤とします。Google の IPU には、オフロードされたネットワーキング スタックと、ネットワーキングのパフォーマンス、分離、セキュリティを高いレベルで実現するプログラム可能なパケット処理エンジンが搭載されています。H3 VM は、デフォルトで 200 Gbps の低レイテンシ ネットワーキングを備えています。これは Google の前世代の VM と比べて 2 倍の速度で、密結合の分散型コンピューティングやネットワーク使用率の高いワークロードに理想的です。さらに、H3 マシンはコンパクト プレースメントもサポートしています。レイテンシとネットワーク ジッターを低減するために密集した大きなプールにデプロイされており、HPC アプリケーションのスケーラビリティを向上させます。

「金融サービスやライフ サイエンスなどの幅広い基幹産業が、極めて要求の厳しいコンピューティングの課題に取り組むために、HPC 技術をますます頼りにしています。この増大するニーズに応えるため、Intel と Google Cloud は、Intel のコンピューティングと IPU における最新のイノベーションを 1 つのプラットフォームに集約した目的特化型の HPC VM インスタンスを構築するために提携しました。第 4 世代 Xeon スケーラブル プロセッサが提供するワークロード加速能力により、H3 は、業界をリードするコスト パフォーマンスに優れた HPC ワークロード用プラットフォームになります。」 - Intel、Xeon プロダクト & ソリューションズ グループ、コーポレート バイス プレジデント兼ゼネラル マネージャー、Lisa Spelman 氏

費用とパフォーマンス

Google は、H3 のパフォーマンスがどれだけ向上したかを調べるため、業界標準のベンチマーク テストを行いました。以下の結果から、H3 VM は前世代の VM よりも短時間で効率的に結果を生成できることがわかります。このテストでは、天気予報(WRF)、分子動力学(LAMMPS、Quantum Espresso)、自動車衝突シミュレーション(Ansys LS-DYNA、Altair Radioss)、数値流体力学(OpenFOAM)などのよく知られた一連の HPC ベンチマークについて、H3 のフル サーバーノードと C2 を比較しました。

その結果、一連の HPC ワークロードにおいて、H3 VM は前世代の C2 マシンよりも最大 3 倍高いパフォーマンスを示しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1._Chart_1.max-1700x1700.png

H3 は、密結合のマルチノード ワークロード用に最適化されています。WRFv3 天気予報テストでは、H3 は高い並列効率を維持したまま、C2 より 2 倍多いコア数までスケールアップできました。たとえば、WRFv3 2.5 km 天気予報では、90% の効率で 4,000 を超えるコア数までスケールできました。これは、C2 で同じワークロードを実行した場合と比較して 2 倍多い数です。

パフォーマンスの向上に加えて、H3 は費用対効果も高く、HPC ワークロードにおけるコスト パフォーマンスは Compute Engine ポートフォリオの中で最も優れています。H3 VM は、C2 VM と比較してコスト パフォーマンスを最大 2 倍改善します。天気予報(WRFv3)のテストにおいて、H3 は C2 より 50% 低い費用で結果出力までの時間を最高で 3 分の 1 に短縮しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2._chart_2.max-1600x1600.png

お客様とパートナー様の声

https://storage.googleapis.com/gweb-cloudblog-publish/images/Altair.max-700x700.jpg

「Altair で行った H3 の初期テストでは、Radioss ワークロードのシミュレーション実行時間が C2 と比較して最大 3 分の 1 に短縮されました。Google Cloud Platform での実行時間がこれほど大幅に短縮されると、両社に共通のお客様はエンジニアリングの生産性を高めることができるでしょう。」 - Radioss Development and Altair Solver、シニア バイス プレジデント、Eric Lequiniou 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/rescale.max-700x700.jpg

「Rescale のお客様は要求の厳しいアプリケーションを幅広く利用しており、Google Cloud による最新のハイ パフォーマンス コンピューティング(HPC)技術の恩恵を受けています。このたび Google Cloud から、HPC のお客様が持つ独自のニーズに特化した H3 VM ファミリーがリリースされたことを非常に嬉しく思います。新しい H3 VM は、最新の Intel 第 4 世代プロセッサ、大容量メモリ、低ネットワーク レイテンシといった特性を兼ね備えており、数値流体力学、有限要素解析、分子動力学のようなさまざまなコア HPC ワークフローにおいて、C2 マシンよりも最大 3 倍高いパフォーマンスを提供します。」 - Rescale、HPC エンジニアリング担当 VP、Mulyanto Poort 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/totalcae.max-700x700.jpg

「GCP H3 インスタンスのおかげで、CAE ワークロードのコアあたりのパフォーマンスが C2 より最大 25% 向上し、ジョブ費用も 50% 低下しました。これにより、GCP で CAE ワークロードを実行するお客様に最大 2.5 倍高いコスト パフォーマンスとスケーラビリティを提供できます。」 - TotalCAE、CEO、Rodney Mach 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/ParallelWorks.max-700x700.jpg

「新しい H3 マシンシリーズにより、複数ノードで実行したときのパフォーマンスが 2.5 倍以上向上し、全体的なジョブ費用も 50~70% 節約できました。H3 の低費用とパフォーマンス レベルは、数値気象予測業界のリーダーにとって欠かせないものとなるでしょう。」 - Parallel Works、社長、Matthew Shaxted 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/Airshaper.max-700x700.jpg

「AirShaper では、CFD シミュレーションを定額料金で提供しています。通常は、コアの数が多いほど、そしてコアが高速なほど、総費用は高くなり、その原因の一つにはスケーリングの問題があります。しかし H3 では、シミュレーション時間を 2 分の 1 に短縮することができ、そのうえ総費用も低下するのには驚きました。」 - Airshaper、CEO、Wouter Remmerie 氏

https://storage.googleapis.com/gweb-cloudblog-publish/images/Brightskies.max-700x700.jpg

「一般的な HPC ベンチマークを使用して Google Cloud の新しい H3 HPC インスタンスをテストしたところ、既存のほぼ同等の物理的 HPC システムのパフォーマンスを上回る結果が得られました。エクスペリエンスはスムーズかつ簡単で、HPC のお客様にぜひ H3 インスタンスをご利用していただきたいと願っております。」 - Brightskies、CEO、Khaled El Amraw 氏

H3 VM を今すぐ使ってみる

H3 VM は現在、US-central1(アイオワ)と Europe-west4(オランダ)の各リージョンで提供されています。H3 インスタンスの使用を開始するには、Google Cloud コンソールでこれらのリージョン用の新しい VM または GKE ノードプールを作成するときに、コンピューティング最適化マシン ファミリーに属する H3 を選択します。H3 VM マシンシリーズの詳細については、こちらをご覧になるか、Google Cloud の営業担当者にお問い合わせください。お問い合わせ | Google Cloud


出典: Google 内部データ、2023 年 7 月


- Google Compute Engine シニア プロダクト マネージャー Garv Sawhney
- HPC チーフ テクノロジスト
Bill Magro

投稿先