コンテンツに移動
顧客事例

大学共同利用機関法人 情報・システム研究機構 国立極地研究所:海氷分布予報の計算を同一コア数でオンプレの 2 倍に高速化

2021年1月27日
https://storage.googleapis.com/gweb-cloudblog-publish/images/hero_image_kokuritsukyokuchi.max-2600x2600_mTmVSWo.jpg
Google Cloud Japan Team

大学共同利用機関法人 情報・システム研究機構 国立極地研究所(以下、極地研)では、北極域研究のナショナル フラッグシップ プロジェクトである北極域研究加速プロジェクト(ArCS II:Arctic Challenge for Sustainability II)を推進。このプロジェクトにおける北極海海氷分布予測のハイ・パフォーマンス・コンピューティング(HPC)基盤として、Google Cloud が採用されています。 極地研の特任研究員、国立大学法人 東京大学(以下、東京大学)大学院新領域創成科学研究科の教授、および特任研究員に話を伺いました。

利用している Google Cloud サービス:Compute EngineFilestoreCloud Source RepositoriesGoogle Workspace

ArCS II の海氷分布予報のハイ・パフォーマンス・コンピューティング(HPC)基盤に Google Cloud を採用

「1995 年に、北極海航路の国際共同研究プロジェクトでロシアの耐氷貨物船をチャーターし、横浜からノルウェーまで調査航海をしました。当時、海氷を避けながら航海するためのデータとして、先行する船からの情報はありましたが、目前の海氷を避ける、避けないなどの判断は船長の勘と経験でした。海氷は急激な変化をするため、精度の高い海氷分布予報の重要性を痛感しました」東京大学 大学院新領域創成科学研究科 海洋技術環境学専攻 海洋情報基盤学分野 教授の山口さんは、当時をこう振り返ります。
https://storage.googleapis.com/gweb-cloudblog-publish/images/IMG_7963.max-2200x2200.jpg

「氷海航行を、昔のような “冒険” には、もうしないという思いから、帰国してすぐにセンシング、モデルと予測、衛星モニタリングなどの技術を組み合わせた氷海航行支援システムを設計し、国際シンポジウムで発表しました。25 年かけて、この仕組みを実現することができました」(山口さん)

現在山口さんは、極地研、国立研究開発法人海洋研究開発機構(JAMSTEC)、および国立大学法人北海道大学の 3 機関が中心となり、2020 年 6 月~2025 年 3 月の約 5 年弱で実施される ArCS II に参画しています。

ArCS II では、極地研 で天気予報データを取得し、10 日先までの海氷分布予報を計算し、衛星を経由して、北極海を航海する JAMSTEC の海洋地球研究船〈みらい〉に送信する海氷分布・海洋予報モデル(IcePOM)を構築。海氷分布予報の計算インフラ(HPC)基盤として、Google Cloud が採用されています。

Google Workspace との連携を評価して Google Cloud を推薦

ArCS II は、2015 年度~2019 年度に実施された北極域研究推進プロジェクト(ArCS)の後継プロジェクトです。ArCS においても、海氷分布予報を計算していましたが、最大の違いは計算インフラにオンプレミスのサーバーを利用していたことです。オンプレミスの課題を山口さんは、次のように語ります。

「大学の研究室でサーバーを所有し続けるのは非常に大変です。トラブルが発生すると、研究者が SE の仕事をしなければなりません。性能が不足すると、新しいサーバーを調達するための時間と労力、コストがかかります。スーパーコンピューターもありますが、ジョブ待ちに入るといつ計算が終わるかわかりません」

明日の海氷分布予報を、明後日に送っても意味がありません。そのため海氷分布予報は、10日先までを6 時 30 分~14 時 45 分の約 8 時間以内で計算するという時間の制約もありました。山口さんは、「ArCS の担当者からオンプレミスからクラウドへ移行することで 2 倍速くなると聞いたので、極地研 国際北極環境研究センター 特任研究員の照井さんに相談しました」と話します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/IMG_7948.max-2200x2200.jpg

「ちょうど私の管理している北極域データ アーカイブ システム(ADS) のサーバーのクラウド化について、いくつかのクラウドサービスと比較検討していました。その中で Google Cloud の担当者にも色々と相談していたところでした。今回の計算インフラの相談があり、極地研と東京大学の複数の利用者を想定しなければならないことと、両機関で Google Workspace を使っていたことから、認証と認可を考えて Google Cloud を推薦しました」(照井さん)

Google Cloud による検証環境の短期構築経験を生かし、本番環境を 3 日で構築

海氷分布予報の計算インフラのクラウド化にあたり、検証環境と本番環境を構築しています。検証環境は、2020 年 7 月より検討を開始し、8 月 11 日~24 日で構築。本番環境は、9 月 8 日~10 日で構築しています。「検証環境の経験とノウハウを生かせたので、本番環境は 3 日で構築できました」(照井さん)

検証環境は、仮想マシンに Compute Engine、モデルのデータを保存するために Cloud Filestore、OS に Linux を使って検証環境を構築。極地研と東京大学では、Google Workspace を利用していたので、新たに ID / パスワードを発行する手間なく、既存のアカウントによる認証と認可で Google Cloud へアクセスしています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Blog1Guo_Li_Ju_Di_Yan_Jiu_Suo__architecture1.max-700x700.png

「マシンタイプは 8 CPU、32 GB メモリを選択し、複数の CPU のアーキテクチャを使って検証しました。その結果、14 時間弱で終わったので、CPU を増やしていけば 8 時間以内で計算できるという見込みが立ちました。オンプレミスとクラウドで同一コア数の計算速度を比較したところ、アーキテクチャの違いだけで、約 2 倍早くなったのは驚きでした」(照井さん)

検証の結果を受けて、本番環境を構築。海氷分布予報の計算環境(compute-kona)、また開発 / テスト環境(development-columbia)の仮想マシン(VM)として、Compute Engine を利用。Compute Engine は、モデルを計算する時間だけ 64 CPU を使い、モデルの計算が終わったらシャットダウンする仕組みにしています。

 また、計算結果を保存するファイルストア(fs-bluemountain)には Cloud Filestore を、ソースコード管理のリポジトリには Cloud Source Repositories を利用。さらに 24 時間アクセスできる最小の VM(login-mocha)から gcloud を使うことで、Google Cloud の VM の制御や、Google ドライブとのデータ共有に利用しています。研究者は、Google ドライブから海氷分布予報をダウンロードして、各自の研究に利用できます。

 海氷分布予報の計算結果は、login-mocha から SFTP で ADS のサーバーにダウンロードされ、衛星通信により、〈みらい〉に転送されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Blog2Guo_Li_Ju_Di_Yan_Jiu_Suo__architecture2.max-800x800.png
https://storage.googleapis.com/gweb-cloudblog-publish/images/IMG_7941.max-2200x2200.jpg

東京大学 大学院新領域創成科学研究科 特任研究員の藤原さんは、「海氷分布予報のためのシミュレーションは、すでに作られていたプログラムを活用しています。ADS から受け取った天気予報データを加工して、シミュレーションで使えるようにする前処理から毎日決まった時間に VM を立ち上げ、計算が終わったらシャットダウンする処理、および出力された海氷分布予報を ADS に送信するまでの一連のプロセスをGoogle Cloud 上で自動的に行うシステムを開発しました」と話します。

Google Cloud のサポートについて照井さんは、「Google Cloud の担当者には、かなり初期の段階から、秒単位の課金やアーキテクチャの違いがモデル計算のパフォーマンスに与える影響、gcloud コマンドで VM をオン / オフする方法、ログの取得な方法ど、マニアックな問い合わせも対応してもらえました」と話しています。

計画停電にも影響を受けない Google Cloud には安心感

Google Cloud の導入効果を照井さんは、次のように話します。「VM のスクラップ&ビルドが非常に楽です。本番用のVM ができるまでに何度か失敗もありましたが、10 台程度の VM を 5 分 ~ 10 分程度で準備ができるため、試行作業が容易です。感動したのは、コスト計算が容易なこと。オンプレミスでは、64 CPU のサーバーの購入に数百万円の予算が必要で、予報計算の計算単価を見積もるのが困難です。Google Cloud は、1 回あたりの予報計算に必要な予算を 1,000〜2,000 円程度と見積もることができました」

また藤原さんは、「より精度の高い予測のための研究に、引き続き Google Cloud を利用しています。Google Cloud は、CPU やメモリの設定、アーキテクチャを柔軟に変更でき、開発もテストも簡単にできるので非常に魅力的です。また、〈みらい〉航海期間中に東京大学で計画停電があり、オンプレミスのサーバーが止まったのですが、Google Cloud はそのような影響を受けないので、心理的に非常に安心感がありました」と話します。

今後の計画について山口さんは、「2021 年も、〈みらい〉の航海は予定されているので、IcePOM の改善を続けていきます。また北極海を運航している海運会社に使ってもらい、足りない情報や要望などを研究者にフィードバックしたいと思っています。現在は海氷の予報だけですが、波の情報と組み合わせるなど、モデル計算の改良も進めていく計画なので、今後も Google Cloud のサポートに期待しています」と話しています。


https://storage.googleapis.com/gweb-cloudblog-publish/images/IMG_7934.max-2200x2200.jpg

(写真左から)

・国立大学法人 東京大学

 大学院新領域創成科学研究科 海洋技術環境学専攻 海洋情報基盤学分野 教授 山口 一 氏

・国立大学法人 東京大学

 大学院新領域創成科学研究科 特任研究員 藤原 泰 氏

・大学共同利用機関法人 情報・システム研究機構 国立極地研究所

 国際北極環境研究センター 特任研究員 照井 健志 氏

大学共同利用機関法人 情報・システム研究機構 国立極地研究所

1973 年に「極地の観測と総合的研究を行う」ことを目的として設置された大学共同利用機関。南極圏と北極圏に観測基地を擁し、極域科学を総合的に推進。また、大学共同利用機関として、全国の研究者に南極・北極における観測の基盤を提供するとともに、共同研究課題の公募や、試資料・情報の提供を行っている。北極観測では、2011 年度から GRENE 北極気候変動研究事業、2015 年度からは北極域研究推進プロジェクト(ArCS)、そして 2020 年度から北極域研究加速プロジェクト(ArCS II)の代表機関を務め、国内外の研究機関と連携して北極研究に取り組んでいる。


その他の導入事例はこちらをご覧ください

投稿先