EFPL の Swiss Plasma Center、Google Cloud で核融合のシミュレーションを目指す
Google Cloud Japan Team
※この投稿は米国時間 2021 年 6 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。
新しいクリーン エネルギー源の開発は、世界に大革命をもたらす可能性があります。EPFL(スイス連邦工科大学ローザンヌ校)の Swiss Plasma Center は、まさにそれを実現しようとしており、科学者たちは、強磁場を使用して最大 1 億度で水素を閉じ込めることで、恒星のような核融合反応が発生する条件を作ろうとしています。その結果、大量のクリーン エネルギーが放出され、世界のエネルギー問題を解決できるのです。
Swiss Plasma Center は、EUROfusion プログラムの一環として、ITER の開発に関わっています。ITER とは、建設中の世界最大級の科学実験施設であり、その目的は、大規模な核融合反応の実現可能性を証明し、核融合実証炉である DEMO への道を切り開くことです。核融合が成功すれば、温室効果ガスや長期放射性廃棄物を生じさせることなく、世界のエネルギー問題を解決できる可能性があります。こうした実験施設で行われる物理シミュレーションは、このプロセスにとって欠かせません。
私の仕事は、EPFL の科学 IT 兼アプリケーション サポート担当オペレーション担当ディレクターとして、このような科学プロジェクトにハイ パフォーマンス コンピューティング(HPC)のリソースを提供することです。Swiss Plasma Center の Paolo Ricci 教授は次のように説明しています。「核融合動力の分野では、テクノロジーの最前線にある ITER などの大規模な実験施設を構築するだけでなく、最先端の理論研究を行うことで、物理現象をより適切に理解、解釈、予測する必要があります。このような予測は、世界で最も強力なコンピュータを必要とする大規模なシミュレーションに基づいています。研究者たちには、そのような計算を実施するための運用サポートが必要です。」7 月 1 日以降、EPFL は EUROfusion の Advanced Computing Hub の 1 つをホストします。ヨーロッパでの核融合のシミュレーションを実施するソフトウェアの開発をサポートし、その運用を私が取り仕切る予定です。
こうした大規模なシミュレーションを実施するために、Ricci 教授のグループは GBS というソフトウェアを開発しました。GBS シミュレーションの目標は、1 億度のプラズマコアを、それよりはるかに低い数百度の温度に保つ必要のある装置の壁から分離する、厚さわずか数センチメートルの狭い層の物理特性を表現し、理解することです。この温度勾配は、おそらく宇宙で最も強いもので、きわめて複雑な非線形マルチスケールとマルチフィジックス現象で占められています。この領域を正確に表現することは、トカマクの性能を把握するために重要であるため、ITER の最適な運用に欠かせません。
Google Cloud で大規模なエネルギー シミュレーションを導入
中規模から大規模のトカマク(核融合反応が発生する装置)を正確にシミュレーションするには、膨大な処理能力が求められ、Tier-0(現在はペタフロップス対応)のスーパーコンピュータが必要です。ただし、Tier-0 スーパーコンピュータのリソースとアクセスは限られています。したがって、Google Cloud で GBS などのシミュレーション コードのパフォーマンスを把握し、より幅広い科学コミュニティがテクノロジーを利用できるようすることが重要です。
Google Cloud の HPC VM イメージを使用すると、SchedMD が管理する slurm-gcp プロジェクト の TerraForm レシピを使用して、完全にローカライズされたコンピューティング クラスタをデプロイできます。ユーザーは、EPFL LDAP アカウントを使用してクラスタのフロントエンドにアクセスします。そして私たちは、スーパーコンピュータに広く使用されているパッケージ マネージャーである Spack を使用して、オンプレミスで提供しているものと同じコンピューティング環境をインストールします。全体としては、EPFL で管理しているものと実質的に同じ、柔軟で効果的な HPC インフラストラクチャを 15 分足らずでデプロイし、需要が高いときにはオンプレミスのワークロードを動的にオフロードできるようになりました。
Google Cloud の HPC VM イメージを使用して、TCV と JT60-SA の 2 つのトカマクで GBS のパフォーマンスをテストしたところ、要求の厳しい大型トカマクでも優れたスケーリングが発揮されました。「解決までの時間」に関しては、Tier-0 スーパーコンピュータと Google Cloud で実行されているソルバーの 1 回の反復処理を比較しました。Google Cloud の HPC VM イメージの使用では、Tier-0 スーパーコンピュータに比肩する結果を 150 ノードまで得られました。これは、Google Cloud によって柔軟性が向上されることを考えれば、素晴らしい結果です。
Tokamak Configuration Variable(TCV)ジオメトリを使用した結果では、優れたスケーラビリティが得られました。TCV トカマク シミュレーションでは速度が 33 倍向上し、32 ノードまではほぼ完璧なスケールアップが実現されました。
HPC VM イメージのパフォーマンスをテストするために、JT60-SA をベースにした構成を使用して、同じ乱流シミュレーションも実施しました。JT60-SA は、ITER と同様のジオメトリで日本で動作する大規模な高度なトカマクです。そのサイズゆえに、このトカマクのシミュレーションは未知数が約 10 億に達する時点で非常に厳しいものになりますが、150 ノードまではきわめて良好な結果が得られました。
世界のエネルギー問題を解決することは、複雑な課題です。解決のためには、私たちの取り組みにスケーラビリティと順応性を備え、最先端のコンピューティング テクノロジーを活用する必要があります。Google Cloud は、現在使用している強力な Tier-0 スーパーコンピュータを補完するために必要なパフォーマンスと柔軟性を提供してくれます。
Google Cloud での HPC の詳細については、こちらをご参照ください。
-EPFL オペレーション担当ディレクター Gilles Fourestey 博士
-Google Cloud カスタマー エンジニアリング マネージャー Grazia Frontoso 博士