顧客事例

東京大学素粒子物理国際研究センター:TensorFlow+Cloud TPU で素粒子物理学の発展を牽引

hero_image_ICEPP_01.jpg

今回、紹介するのは、東京大学本郷キャンパスの中央、安田講堂のさらに奥、理学部 1 号館内に居を構える東京大学素粒子物理国際研究センターにおける Google Cloud Platform(GCP)の活用事例。素粒子物理学の研究をとおして、いまだ明らかになっていない、宇宙の 95% を占める「暗黒物質」「暗黒エネルギー」の正体を見極めようという同センターの取り組みに、GCP がどのように活用されているか、浅井センター長、田中教授、齊藤特任助教にお話しいただきました。


※バナーは、大型ハドロン衝突型加速器(LHC = Large Hadron Collider)の衝突点に置かれた ATLAS 検出器内部のイメージ(©︎CERN)

利用している Google Cloud Platform サービス:Cloud TPUTensorFlow

TensorFlow + Cloud TPU で解析速度・効率をアップデート

欧州合同原子核研究機構(CERN)にて行われている ATLAS 実験は、スイス・ジュネーブの地下 100m に配置された 1 周 27km もの大型ハドロン衝突型加速器(LHC=Large Hadron Collider)を使って陽子同士を衝突させ、その際に生じた物理事象を検出・解析するという国際共同実験。2012 年 7 月にはこの実験によって、物質に「質量」をもたらすヒッグス粒子が “発見” され大いに話題となりました。

東京大学素粒子物理国際研究センターは、そうした素粒子物理学研究を推進する国内重要拠点の 1 つ。先に挙げたヒッグス粒子発見においても、同センターが主導するアトラス日本グループが大きな貢献を果たしています。しかし、研究はまだまだ道半ばだと、浅井センター長は言います。

「ヒッグス粒子の発見によって、20 世紀後半に確立された『標準理論』が完成しました。しかし、この宇宙には『標準理論』だけでは説明できないさまざまな問題があります。暗黒物質の発見は、その問題を解決するために必要な研究の 1 つ。東京大学素粒子物理国際研究センターでは、今後も LHC から得られるデータを解析していくことで、新たな物理学を切り拓いていきます。」(浅井さん)

ICEPP01.jpg

そうした取り組みを推進していくにあたり、浅井さんが注目したのが、世界中でさまざまなサービスを展開している Google の存在。「今後重要性が増していく、アンフォーマッテッド データの取り扱いに長けている Google Cloud 」(浅井さん)の技術とノウハウを駆使することで、研究のさらなる効率化が図れるのではないかと考え、数年前から、さまざまなコラボレーションの形を模索してきました。そして、その中で有望な取り組みとなりそうなものの 1 つが、TensorFlow と、そのディープ ラーニング モデルのトレーニングと実行を劇的にアクセラレーションさせる Cloud TPU の利用です(大学・研究機関においては国内初)。

「LHC で加速した粒子(陽子)を衝突させると、約 1 万の粒子が生成されて周囲に飛び散ります。ATLAS 実験では、それを数 cm 間隔で設置した検出器を使って点として記録、さらにそれらの点を繋ぎ(トラッキング)、まとめて解析することで暗黒物質の存在した証拠を探し出そうとしています。しかし、この実験で記録されるデータは去年だけで約 70 億事象にも至り(現在は、合計 500 ペタバイト = 50 万テラバイトものデータを世界中で分散保有)、今後、LHC のアップデートによってさらに増えていくことが確実です。現在はまだ何とかなっていますが、将来に向けてより高速な方法を見つけだす必要がありました。」(田中さん)

ICEPP02.png

その結果、行き着いたのが Tensorflow と Cloud TPU の組みあわせ。運用を担当する齊藤さんは次のように、そのメリットを説明してくれました。

「まだ使い始めたばかりということもあり、CPU を使った既存のアルゴリズムと比べて充分なパフォーマンスは引き出せていません。しかし、TensorFlow を GPU 上で動かすのと比べ、Cloud TPU では 3 倍という優れた計算結果を記録しています。最適化が進み、より適切なアルゴリズムを見つけることができれば、既に最適化が完了している CPU 以上のパフォーマンスも実現できるでしょう。」(齊藤さん)

「ここで注意しておきたいのが、TensorFlow 上では、そもそものアプローチが従来と異なっていること。それまでは観測された点と点を総当たりで正しく結んでいくという手法を採っていたのですが、今回はディープ ラーニングを駆使して、素粒子がどのように飛び散っていくかの法則を見つけだし、より効率的にトラッキングできるようにすることを目指しています。これがうまく行けば、従来は計算量を削減するために間引いていたデータも解析できるようになります。なお、現在はこうした解析作業を素粒子のトラッキングにのみ使っていますが、今後は、それらのデータから新粒子を探す段階にも活用していきたいと考えています。」(田中さん)

最新のリソース・技術をローコストに利用できるのも魅力的

TensorFlow と Cloud TPU の組みあわせによって得られたのは「速度」だけではありません。他にも多くのメリットがあったと言います。

「これまで東京大学素粒子物理国際研究センターでは、クラウド プラットフォームを研究に活用したことはなかったのですが、今回、始めて GCP に触れたことで、多くのメリットを感じました。例えば、低価格で常に最新のリソースを使えるというのは非常に魅力的。現在、我々は 高額な GPU を導入しているのですが、これらはわずか数年で陳腐化し、速度的なメリットが失われてしまいます。しかし、クラウドを使えばそうした心配をする必要がありません。特に小規模な研究では重宝しそうです。」(田中さん)

「これは他のフレームワークにも言えることなのですが、TensorFlow では簡単にモデルが作れてしまうことに感心しました。こうしたクラウド プラットフォームを使うのが初めてだったということもあり、仕組みを覚えるのに少しだけ苦労しましたが、そこを乗り越えてしまえば、後はスムーズでした。また、GPU 向けに構築したアルゴリズムを、そのまま Cloud TPU へ持ち込めることにメリットを感じました。」(齊藤さん)

ICEPP03.jpg

また、今回、TensorFlow と Cloud TPU を使っていく中で、GCP のそれ以外のプロダクトにも可能性を感じたそうです。

「管理者からすると、Kubernetes が気になっています。大学の研究施設では、 サイエンスを行う研究組織なので、研究者ではない専任のエンジニアを雇用することが難しいのですが、フルマネージドな Google Kubernetes Engine ならそれらをすべて自動化することが可能です。大学ではオンプレミス環境をゼロにしたくないので、これらも含めてシームレスに管理できる GKE On-Prem に期待しています。」(田中さん)


icepp-logo-colorA.png
ICEPP04.jpg

写真左から

  • 素粒子物理国際研究センター・センター長、理学系研究科物理学専攻・教授、博士(理学) 浅井 祥仁氏

  • 素粒子物理国際研究センター ・教授、博士(理学) 田中 純一氏

  • 素粒子物理国際研究センター・特任助教、博士(理学) 齊藤 真彦氏

東京大学素粒子物理国際研究センター

1974 年に設立された東京大学理学部附属高エネルギー物理学実験施設が前身(その後、数度の改組を経て、1994 年に東京大学素粒子物理国際研究センターに)。現在取り組んでいる主なプロジェクトは、ATLAS 実験、MEG 実験、ILC 計画の 3 つの実験・計画。2010 年には文部科学省から「共同利用・共同研究拠点」の認定(2016 年より認定更新)を受け、国内外の研究機関・研究者との連携を強めている。


東京大学素粒子物理国際研究センターの導入事例 PDF はこちらをご覧ください。

その他の導入事例はこちらをご覧ください。