Google Cloud AI と Harvard Global Health Institute、共同で新たな COVID-19 予測モデルを開発
Google Cloud Japan Team
※この投稿は米国時間 2020 年 8 月 4 日に、Google Cloud blog に投稿されたものの抄訳です。
COVID-19(新型コロナウイルス感染症)のパンデミックは世界中に大きな影響をもたらしました。人々の生活習慣は一変し、互いへの思いやりの中から数々の優れた活動も生まれました。こうした状況において、疲れを知らぬ努力で対応にあたってくださっている皆様がいる最前線の現場ほど、混乱と忍耐が顕著に表れている場所はありません。
Google Cloud は Harvard Global Health Institute とのパートナーシップのもと、COVID-19 Public Forecasts をリリースしました。これは、医療、公共部門、このパンデミックの影響を受けているその他の組織が今後の対策を立てる際に役立つ追加リソースとして開発されたものです。このサービスでは米国内の各州および郡における以後 14 日間の COVID-19 感染者数、死亡者数、その他の指標に関する予測データが提供され、利用は無料です。
COVID-19 Public Forecasts は、ジョンズ ホプキンス大学、Descartes Lab、米国国勢調査局などが一般公開しているデータを使用してトレーニングされていて、今後も Harvard Global Health Institute の監修のもとで更新が続けられます。
「COVID-19 Public Forecasts モデルは、公共衛生の実施において最重要となる行政区分、つまり郡を単位として予測データを生成します。Harvard Global Health Institute が郡レベルでまとめている COVID-19 抑制指標と、COVID-19 Public Forecast Model のデータを組み合わせることで、ピンポイントでの検査や郡単位での衛生施策の実施が可能になります。感染事例、感染者数、入院者数、死亡者数に関する正確な予測を迅速に施政者と市民に伝えることができるので、急速に拡大しつつある COVID-19 パンデミックに関する理解を深め、すばやく対処していくための一助となってくれるはずです」と、ブリガム アンド ウィメンズ病院外科所属外科医兼ハーバード大学 T.H. チャン公衆衛生大学院医療政策管理学部所属医療政策研究員を務める Thomas Tsai 博士は述べています。
COVID-19 Public Forecasts は他のデータソースとともに、各地域で COVID-19 の感染拡大を把握し、対策を立てようと最前線でパンデミックと戦っている方々にとって有益なリソースとなり得ます。たとえば、医療機関は COVID-19 感染者の予測値をデータポイントの 1 つとして参照し、個人防護具、スタッフ、スケジュールなどのリソース プランニングに役立てることができます。また、州や郡の保健衛生担当部門は、以後 2 週間にわたる感染者数の予測値を参考にして、検査戦略の立案や集団感染リスクの高い地域の識別を行うことができます。
HCA Healthcare の最高データ責任者である Edmund Jackson 博士は、次のように述べています。「医療機関にとって、パンデミックの進行状況を正確に予測できる能力は COVID-19 による危機に対応していくうえで欠かすことができません。Google がこの問題の解決のために独自の演算処理能力と強力な AI を提供してくれることは、非常に心強いです。この活動に携われることを嬉しく感じています。」
COVID-19 Public Forecasts のデータを生成するために、Google Cloud の研究者たちは AI と膨大な疫学的データを組み合わせたまったく新しい時系列機械学習アプローチを開発しました。その仕様により、この新モデルは一般公開データを使用してトレーニングを施されます。また、採用されているアーキテクチャでは、研究者がモデルの学習した関係性を詳しく調査し、特定の予測値の算出に至った道筋をたどることもできます。Google では、これらのデータがモデルの動作が広く理解されるために役立つだけでなく、今後の感染症モデリングの革新にもつながっていくことを願っています。
COVID-19 Public Forecasts に対する、BigQuery を使用したクエリの発行と、CSV ファイル(州単位の予測値の CSV と郡単位の予測値の CSV)のダウンロードは無料で利用できます。また、このデータは Google データポータルのダッシュボードと National Response Portal にも表示されます。Google ではこの新しい方法論と使用したデータセットに関する詳細な説明をホワイト ペーパーとユーザーガイドで公開しています。他のあらゆる予測と同様、COVID-19 Public Forecasts にも限界はあり、決断の参考として使用する際にはそれらを注意深く考慮する必要があります。Google の利用規約に同意いただいたうえで、予測データをダウンロードしご活用ください。
Google は AI に関する中核的な一連の原則に従っています。COVID-19 Public Forecasts の開発にあたり、Google ではこの疾病による影響の不均衡性と、それによりこの原則への準拠、特に第 2 項「不公平なバイアスの発生、助長を防ぐ」への準拠にどのような影響が及ぼされるかを熟慮しました。CDC(アメリカ疾病予防管理センター)の研究によると、米国内の有色人種コミュニティは COVID-19 の影響を特に強く受けていて、感染者数と死亡者数のどちらもそれ以外のコミュニティと比べて高くなっています。Google の担当チームは公平性に関する詳細な分析を行い、そうした不均衡性が予測の正確性に与える影響とその適切な読み取り方について調査しました。COVID-19 Public Forecasts を部分的にでも決断の参考にすることを検討している場合は、公平性に関する分析をよくご覧になることをおすすめします。また Google では、そうした不均衡性にどのように対処し、さまざまな AI モデルで表出するその影響をどのように計測するべきかについて、公衆衛生担当者と AI コミュニティとの間でオープンに話し合うことのできる場を作ることを提案しています。
Google Cloud は AI を活用したイノベーションにコミットしてきました。その成果を COVID-19 との戦いの最前線にいる方に役立てていただけることを大変嬉しく感じています。COVID-19 Public Forecasts の詳細についてはユーザーガイドとホワイト ペーパーをご覧ください。予測データは BigQuery、データポータルのダッシュボード、National Response Portal から参照できるほか、CSV データ(州、郡)としてダウンロードできます。
-Google Cloud AI プロダクト マネージャー Dario Sava