COVID-19 一般公開データセット: パンデミックに対応する組織を支援
Google Cloud Japan Team
※この投稿は米国時間 2020 年 8 月 15 日に、Google Cloud blog に投稿されたものの抄訳です。
編集者注: この記事は、COVID-19(新型コロナウイルス感染症)一般公開データセットに関するシリーズの第 2 回にあたります。最近オンボードされたデータセットと新しいプログラムの拡張について詳しくは、第 1 回の記事をご覧ください。
今年 3 月、Google は Google Cloud 一般公開データセット プログラムに新しい COVID-19 一般公開データセットを導入し、重要な COVID-19 データセットを BigQuery で自由に分析できるようにしました。
リリース時に目指したのは、高品質のデータをできるだけ速やかにユーザーの元に届け、始まったパンデミックをモニタリングして状況を把握する取り組みを支援することでした。数か月後、当初の目標を拡大し、的確な情報に基づく意思決定に必要なデータを提供して、公的部門と民間部門のユーザーをサポートすることも目標に含めました。本日は研究機関、政府機関、パートナーがどのようにこのデータセットを使用して意思決定を強化し、ウイルスとその社会的影響に関する研究の拡大に協力して、対応の取り組みを支援するツールを作成しているかについてご紹介します。
コミュニティによる COVID-19 への対応を支援
医療、政府機関、民間産業のリーダーが COVID-19 に対応した意思決定を迫られているため、信頼性の高いデータはこれまで以上に重要になっています。組織が最も安全な方針を計画するための情報を得られるよう、Google Cloud は Google Cloud パートナー、SADA と協力して National Response Portal を構築しました。
このポータルは、さまざまな関連データセットを組み合わせて、現場に即したビューでパンデミックの様相を見ることができるオープンデータ プラットフォームです。SADA のヘルスケアおよびライフ サイエンス担当シニア ディレクターである Michael Ames 氏は、次のように述べています。「National Response Portal は Google Cloud 一般公開データセット プログラムを最大限に活用しており、簡単に COVID-19 データセットに直接アクセスして状況を可視化できます。」
このポータルを介することで、COVID-19 の感染者数と死亡者数の傾向調査、今後のホットスポットの予測、政策決定と社会的流動性の影響の調査などができます。医療機関は、医療コミュニティ間でデータ分析情報を共有して認知度向上と意思決定を可能にする取り組みの一環として、データの提供を開始しています。
ポータルへはこちらからアクセスできます。
公的部門が COVID-19 のモニタリング手段を構築
COVID-19 の感染者数をモニタリングし住民に最新情報を提供するための技術ソリューションを探していたオクラホマ州保健省と知事部局は、Google Cloud に着目しました。同州はパンデミックのリアルタイム データを表示する一般向けプラットフォームを求めていました。オクラホマ州は COVID-19 一般公開データセットと Looker(Google Cloud のビジネス インテリジェンスと分析のプラットフォーム)を利用して、COVID-19 に関する州統計情報のダッシュボードを作成し、州の公衆衛生ウェブサイトで公開しました。
ダッシュボードはリリース以来、毎日の表示回数は数万にものぼります。オクラホマ州保健省のスタッフと市民は、Looker ダッシュボードによって提供される統合情報にアクセスして操作し、行動につながるインサイトを得ることができています。オクラホマ州のデジタル変革担当責任者である David Ostrowe 氏は、次のように述べています。「Google Cloud とのパートナーシップにより、オクラホマ州保健省は州全体における COVID-19(新型コロナウイルス感染症)の影響にアジャイルに対応し、州民に絶えず情報を提供できるようになりました。」ダッシュボードで手作業による処理の必要性が減り、Google Cloud から簡単に変更の実行やデプロイができます。オクラホマ州は COVID Tracking Project から COVID-19 データの品質について A+ の評価を受けました。
COVID-19 の研究を支援
ノースイースタン大学はパンデミックの初期に Google Cloud を使用して COVID-19 をモデル化し、外出禁止令などの介入がウイルスの感染拡大に及ぼす影響を予測しました。
同大学の研究者は BigQuery など複数の Google Cloud プロダクトを使用してさまざまなデータセットを分析し、グローバルなメタポピュレーション感染症伝播モデルを発表しました。このチームは米国国勢調査データと OpenStreetMap の一般公開データセット、および BigQuery の GIS 機能を利用して、COVID-19 パンデミックの世界的な拡大に対するさまざまな介入の影響を予測しました。
ノースイースタン大学のアソシエイト研究員 Matteo Chinazzi 博士は、次のように述べています。「私たちのチームは何百テラバイトものシミュレーション データを迅速に分析することにより、感染症の空間的拡散をモデル化し予測しています。BigQuery のおかげで、感染症モデルから分析情報をより迅速に引き出し、進行中の流行の進化をより適切に研究することができます。」
Chinazzi 博士のチームは、さまざまな封じ込め戦略や緩和戦略の影響について貴重な分析情報を提供しました。チームの研究結果は 4 月に『Science』誌上で発表されました。データは The Global Epidemic and Mobility(GLEAM)プロジェクトのインタラクティブ ダッシュボードで見ることができます。
パンデミックの可視化
CARTO(BigQuery と統合されたロケーション インテリジェンス プラットフォーム)は、地図に関する技術的な知識を利用して、Google Cloud 一般公開データセットを使用する重要な COVID-19 ダッシュボードを構築しました。
CARTO は国勢調査データを COVID-19 の症例データやこのリアルタイム ダッシュボード内の健康データセットの社会的決定要因と組み合わせて、組織がパンデミックをモニタリングし、対応するのをサポートしています。
CARTO のソリューション エンジニアである Stephanie Schober 氏は、次のように述べています。「私たちは、迅速な回答を求めている閲覧者の役に立つよう、この COVID-19 ダッシュボードを作成しました。COVID-19 の拡大が続く中、Google Cloud の BigQuery コンテンツにより、ダッシュボードで信頼性の高いリアルタイム データを使用できるようになりました。」
CARTO のマーケティング担当バイス プレジデントである Florence Broderick 氏は、次のように述べています。「このパンデミックにおいては位置情報がきわめて重要な役割を持っており、民間部門と公的部門の組織が十分に迅速に対応できるようにしています。CARTO と BigQuery を使用した地理空間分析により、PPE 配布、モビリティ分析、職場復帰計画など、幅広いユースケースが可能になりました。」
同様の可視化の開発にご関心をお持ちの場合は、CARTO の詳細をご覧ください。また、一般公開データが流行の抑制にどのように役立っているかを解説したセッション録画も併せてご覧ください。
ウェブからテレビまでを網羅したグローバルな COVID-19 関連ニュース ナラティブの分析
COVID-19 のグローバル メディア報道を分析し、過去 10 年間の感染症の流行と比較する研究者を支援するために、Google はGDELT Project と提携して複数のマルチモーダル データセットをホストしています。
こうしたデータセットには 152 言語に及ぶメディア報道が含まれており、10 年以上の期間で合計 3 兆を超えるデータポイントがあり、いずれも BigQuery で一般公開データセットとして利用できます。GDELT 創業者の Kalev Leetaru 博士は、次のように述べています。「Google Cloud の AI プロダクトにより、テキスト、音声、画像、動画を豊富なアノテーションに変換して、共通の分類を共有できます。BigQuery は何兆ものデータポイントから行動につながるインサイトを取得し、世界中のメディアが COVID-19 をどのように報道してきたかを理解する手助けになります。」
COVID-19 のメディア描写に関するデータ分析情報(世界的なマスク着用についての傾向分析など)やサンプルクエリについては、GDELT Project Blog をご覧ください。また、BigQuery で直接データを確認することもできます。
また、Google Cloud COVID-19 研究助成金事業では、COVID-19 パンデミックなどの大きなな病気の流行に関する追加のデータ アノテーションも支援しています。この事業は Cloud Speech-to-Text を利用して、米国の 10 の主要局における COVID-19 に関するラジオ報道を比較しています。このデータセットが完成すると、研究者はパンデミックに関するテレビやラジオの報道とオンラインの報道を比較できるようになります。
パンデミック対策を講じる企業の業務管理を支援
民間部門の組織は COVID-19 データセットを活用して、パンデミックへの対応における意思決定に役立てています。
Rolls-Royce は Google Cloud などの業界パートナーと協力して Emergent Alliance を結成しました。このデータ分析同盟は Google Cloud のデータセットを活用してパンデミックへのグローバルな対応支援、景気回復のモデル化、職場復帰の取り組みのサポートを行う方法を探ろうとしています。
Google は、データ所有者との提携、重要なデータセットへの簡単なアクセスおよび無料での分析の提供というミッションを掲げて COVID-19 一般公開データセットをリリースしました。このデータは医療、政府機関、学界、民間産業のさまざまな組織に革新的な方法で使用され、グローバルな対応の取り組みに役立てられており、そのことに私たち自身も励まされています。多くのコミュニティが困難な状況で前進し続ける中、私たちは将来に備えるデータ分析情報によってコミュニティにわずかでもお力添えできればと考えています。
-Google Cloud プログラム マネージャー Johanna Katz / Google Cloud プログラム マネージャー Utsav Banerji