AI & 機械学習

COVID-19 感染予測 (日本版) の公開について

#gcp

Google Cloud は今年 8 月に Harvard Global Health Institute とのパートナーシップのもとで COVID-19 Public Forecasts を公開しました。このサービスは予測開始日から将来 14 日間における米国内の COVID-19(新型コロナウイルス感染症)陽性者数や死亡者数などの予測を提供しています。この度、本サービスを日本にも拡張し、COVID-19 感染予測(日本版)の提供を開始します。日本版では予測開始日から将来 28 日間のあいだに予測される国内の陽性者数や死亡者数等の予測値を表示します。

米国で提供している COVID-19 Public Forecasts は AI と膨大な疫学的データを組み合わせ、さらに、時系列の予測を扱う斬新な機械学習のアプローチを採用することで実現しました。米国向けのこの初期モデルは今年 8 月に初公開され、現在も無償で予測情報を提供しています。この情報はジョンズ ホプキンス大学、Descartes Lab、米国国勢調査局などの一般公開データを基にしており、Harvard Global Health Institute の監修のもとで更新を続けています。今回、日本に拡大するにあたり、新たに 95 %予測区間やデータセットの追加に加え、予測対象期間を拡張した他、モデルの強化による予測精度の改善を行いました。

本日公開する COVID-19 感染予測 (日本版) では、日本全国での感染の広がりに関する予測情報を提供します。このデータは都道府県別に、対象期間である将来 28 日間のあいだに予測される死亡者数、陽性者数、入院・療養等患者数などを示します。また、全国の予測値は都道府県の予測値を足し合わせています。これらの情報はダッシュボードでご覧いただける他、 BigQueryCSV ファイルとしてご利用いただけます。このモデルは、医療機関や公的機関をはじめとする COVID-19 の影響を受ける組織が、今後に向けてより適切な対処を検討・準備する上で参考情報の一つとして利用されることを目的に公開しています。ご利用の際はユーザーガイドを必ず参照くださいますようお願いいたします。

Updated covid-19publicforecasts_jp

日本での提供にあたって

この予測モデルを日本に対応させるに当たり、以下のような調整を行っています。

まず、感染の態様や広がり方(ダイナミクス)の基本条件は、米国版モデルでも日本版モデルでも同じである(例えば、感染は離れた場所よりも近隣の地域で広がりやすい等)という前提のもとに開発されています。その上で、日本版モデルでは、日本のデータセットのみを利用してトレーニングを行っており、使用したデータには厚生労働省が発表している 新型コロナウイルス感染症陽性者数および死亡者数等のオープンデータGoogle のコミュニティ モビリティ レポート平成 27 年国勢調査結果などが含まれています。この様に陽性者数や入院・療養等患者数、死亡者数、また人々の移動状況について国内のデータを使用しているため、予測結果には国内の感染状況やそれに対する人々の反応、さらに生活環境といった日本独自の状況が反映されています。

予測モデルの精度検証では、特定の日付までのデータでトレーニングを行った後、その先 28 日間の予測データを出力させ、実測値と予測値を比較しました。たとえば、10 月 1 日までのデータでトレーニングを行った場合は、10 月 2 日から 30 日までの予測値を出力させ、そのデータを同期間の実測値と比較します。検証の結果、一般的な疫学的コンパートメント モデルや検証用の米国データで十分な精度を示した簡易版モデルと比較して、この予測モデルの精度が優れていることを確認しました。さらに 28 日間の予測以外の各種指標についても米国向けモデルと変わらない精度であることを確認しています。

日本版モデルの開発にあたっては、使用データの包括性、予測結果と国内感染状況との整合性、さらに、モデルの設計及び予測データの検証において慶應義塾大学 医療政策・管理学教室 教授 宮田裕章先生および研究室の先生方に監修していただきました。宮田裕章 先生からは以下のようにコメントを頂戴しています。

「この日本版 COVID-19 予測モデルを学術的な観点からも検証しました。あくまでも限られたデータからの予測であるという限界を正しく踏まえて活用することができれば、このモデルは日本のコロナ対策においてとても重要な手がかりとなります。COVID-19 陽性者数、入院・療養等患者数、死亡者数における、タイムリーな予測を行うことで、政府や地方自治体のより素早く正確な現状把握と対応計画に役立ちます。Google が提供する予測モデルのデータや慶應義塾大学が関与している新型コロナ対策の各種アンケート結果といった様々なデータを組み合わせ、照らし合わせて検討することで、迅速かつ効果的な対策を提案することができるようになるでしょう。」

この予測モデルは、例えば感染者数の予測値をデータポイントの一つとして参照することで、医療機関における医療資材やスタッフ、スケジュール等のリソースプラニングや、検査実施計画の立案、感染拡大の兆候が見られる地域の早期発見等に活用することができます。繰り返しになりますが、あくまで医療機関や公的機関をはじめとする COVID-19 の影響を受ける組織が、今後に向けてより適切な対処を検討・準備する上で参考となる情報の一つとして利用されることを目的に公開しています。利用の際はユーザーガイドを必ず参照し、このデータ単独ではなく複数の参照可能なデータと合わせてご活用くださいますようお願いいたします。

Google Cloud は AI を活用したイノベーションに深くコミットしています。春先に米国版モデルの開発に着手してから 6 か月が経過しました。今回、この予測モデルを日本に展開する上でお力添えをいただいた多くの皆様に深く感謝するとともに、無事提供開始できたことを嬉しく思っています。命を救うために最前線で戦い続けてくださっているすべての方に心からの感謝を捧げるとともに、今後もそのような方たちを支援できるよう尽力してまいります。


- Google Cloud AI Research 責任者 Tomas Pfister