NOAA と Google Cloud: データ公開の取り組みをクラウドで共に実現
Google Cloud Japan Team
※この投稿は米国時間 2021 年 2 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
バレンタイン デーがやって来ましたが、米国海洋大気庁(NOAA)にとって一番大切なのは、保持している環境データを開示して誰でもアクセスできるようにすることです。クラウドは、環境データをこれまで以上に広く普及させるという NOAA の目標に最適です。
2019 年、Google Cloud 一般公開データセット プログラムと NOAA のビッグデータ プログラムの一環として、NOAA と Google は最長で 10 年に及ぶ契約を結びました。このパートナーシップ継続により、NOAA が保持する独自の高品質な環境情報を一般公開して、オープンで公平かつ便利に適時アクセス可能にする取り組みを拡大することができました。
データ分析とアクセスの民主化
NOAA は環境に関する情報の宝庫です。海から太陽まで、さまざまな科学データを収集して配布しています。気候、気象、海洋、沿岸の変化を把握、予測し、生態系と天然資源の保護と管理を支援することは私たちのミッションの一部です。しかし、多くの連邦政府機関と同様に、データの見つけやすさの向上と新たなテクノロジーの採用に苦心しています。現実的に考えて、私たちだけで膨大なデータを求められるスピードで共有することは難しいでしょう。
Google のようなクラウド サービス プロバイダと提携して Google Cloud などのクラウド プラットフォームに移行すると、一般市民が NOAA のデータセットにアクセスできるようになり、それによるコスト増加や連邦政府のデータアクセス サービスの使用に伴うリスクも抑えられます。また、BigQuery や Google Cloud Storage といった高度な処理技術も利用できるようになるため、データ分析が強化され、アクセシビリティが向上します。
Google Cloud やその他のクラウドベースのプラットフォームは、データを無料でオープンにするというビジョンの達成を支援しながら、米国政府の全体的な課題にも適切に対応しています。2019 年 1 月に署名された証拠に基づく政策形成基盤法(Foundations for Evidence-Based Policy Making Act)は、米国政府のデータを一般公開することを全般的に求めています。Google Cloud などのクラウド サービス プロバイダと協力することで、NOAA のデータを万人に向けてアクセス可能にし、データ活用の機会を均等にできています。クラウドを利用するあらゆる人に同じアクセス権限が与えられるため、限られた少数のユーザーだけでなく、多くの方にデータの力を活用いただけるようになります。
Google Cloud との関係と同様、データ配布の官民パートナーシップのもう一つの重要なメリットは、経済を活性化させ、イノベーションを促進できる点にあります。これまで、民間の気象事業のような市場への起業家の参入には非常に高い障壁がありました。独自のシステムとインフラストラクチャを構築、維持できる必要があったため、適切なリソースと接続を利用できる大規模な組織への参入が制限されていたのです。
今では、ノートパソコンと Google アカウントさえあれば、Google Cloud のデータにアクセスできます。Google Cloud で独自の HPC クラスタを起動し、モデルを実行して市場に投入できます。長期のメンテナンスに煩わされることもありません。その結果、小規模企業はデータを活用して、以前はまったく参入していなかった分野で活動できるようになりました。
イノベーションの中軸を担う官民のデータ パートナーシップ
NOAA のデータセットは、官民のデータ パートナーシップの利点を強調する多くの革新的なユースケースに貢献しています。これまでのプロジェクトをいくつかご紹介します。
ザトウクジラの音波探知
Google は NOAA の Pacific Islands Fisheries Science Center による 15 年以上の水中録音を利用し、ザトウクジラの鳴き声を識別するアルゴリズムの開発に協力してくれました。これまで、クジラを識別するための受動的音響観測は、ヘッドフォンを装着した担当者が 1 日中座って手動で行っていました。しかし、音声イベント分析を使用したところ、こうした作業を自動化して保全目標を数十年分進めることができました。現在では、研究者が新しい手法を自在に利用してザトウクジラの存在を自動的に識別できるため、船舶の通行やその他の海上活動などによるクジラへの人為的影響を軽減できます。National Centers for Environmental Information は、何年にもわたり収集してきたすべての音声データのアーカイブを設置しました。これは現在、公開データセットとして Google Cloud でホストされています。
火災検知のための天候予測
私たちのミッションの特に重要な側面の一つは生命の保護です。クラウドやその他の高度なテクノロジーは、状況を市民に知らせて安全を維持するための新たな救命機能の開発を促進しています。NOAA の GOES-16 衛星と GOES-17 衛星は、火災の検出、場所の特定、延焼の追跡をほぼリアルタイムで行える重要なデータセットを提供します。Google は、NOAA のデータと Google Earth Engine のデータ分析機能を組み合わせて新しい山火事境界マップを最近導入し、進行中の山火事の影響を受けた地域に関するより深い分析情報を提供しています。
Google Cloud 一般公開データセットにあるものを含め、NOAA のデータセットを探索し、実験してみてください。すでに一般公開データセットをご利用の場合、ご意見やご感想がありましたらぜひお聞かせください。ご利用になっているデータやその活用方法、今後特に利用したいデータについても教えていただけますと幸いです。
-NOAA ビッグデータ プログラム担当ディレクター Jonathan O'Neil
-NOAA ビッグデータ プログラム担当ビジネス ディレクター Adrienne Simonson