医療分野における分析情報の活用: 安全な AI によるデータ分析
Keith Binder
Customer Engineering Manager, Google Cloud
Google AI for Public Sector
Empowering an Adaptive, Responsible, Secure, and Intelligent way forward
Learn more※この投稿は米国時間 2024 年 7 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
フィットネス用ウェアラブル デバイスやヘルス トラッカーが普及するにつれ、どうすればこの大量のデータから分析情報を取得して医療現場で効率的に活用できるのかが、生物医学研究者の課題となっています。最新の AI ツールとクラウド コンピューティングを使用すると、膨大な量のデータを安全かつ迅速に処理できるため、分析情報の収集と分析が加速されます。ワルシャワ大学コンピュータ サイエンス学部の助教授で、カリフォルニア大学ロサンゼルス校デヴィッド ゲフィン医科大学院の研究員も務める Neo Christopher Chung 氏は、「医療画像処理と電子医療記録は、科学者と臨床医に疾患の分類および予後をより深く理解するための新たな機会を与えてくれるでしょう」と述べています。また、オランダのライデン大学メディカル センターの博士研究員兼イノベーション マネージャーで、スタンフォード大学医科大学院の客員研究員も務める Marieke van Buchem 氏は、「医療現場へのクリニカル AI の導入はここ数年ペースが落ちていましたが、膨大な量の電子医療記録から分析情報を得られる可能性が生まれています。重要なのは、AI を研究の場から医療現場に移行させることです」と述べています。
Chung 氏と van Buchem 氏はいずれも、さまざまな組織に属する研究者が集まり、Google Cloud によって科学的なブレークスルーを促進するグローバル コミュニティ、Google Cloud リサーチ イノベーターの 2022 年コホートのメンバーです。両氏はリサーチ イノベーターとして、Google Cloud のリサーチ クレジットやテクニカル サポート、そして、いずれ共同研究者になる可能性もある他のメンバーとの交流機会を活用することができます。van Buchem 氏は「他のリサーチ イノベーターや Google のスペシャリストとアイデアを交換しながら、Google Cloud によって医療をどのように変革し、これらのアイデアを病院の実際のプロジェクトにどのように応用できるか考えることを楽しんでいます」と話し、Chung 氏は「他の研究者のプロセスを見るのも興味深いですし、他のディープ ラーニング関連の問題からインスピレーションを得ています」と話しています。両氏は、AI とクラウド コンピューティングをどのように活用すれば、最先端のがんリサーチツールをすべての研究者にとって利用しやすいものにし、がん患者の病状や予後の診断を改善できるのかを模索しています。
がん診断を改善するためにアルゴリズムをトレーニング
Chung 氏は、生物医学的な予測の改善を目指して解釈可能なディープ ニューラル ネットワークを開発およびトレーニングしている欧州のコンソーシアム INFORM(Interpretability of Deep Neural Networks for Radiomics)のリード AI / ML 主任調査員でもあり、AI を活用して CT スキャンや PT スキャンなどのがんの病理画像を検証しています。The Cancer Imaging Archive(TCIA)や米国立衛生研究所(NIH)の大規模なデータセットは、数百ギガバイトから数十ペタバイトに及ぶ場合もあります。Chung 氏によると、現在の AI モデルはトレーニングに使用された一般的な画像の処理には力を発揮するものの、プライバシー保護や規制上の理由から、医療画像を収集して分析することはより困難です。同氏の目標は、自然画像データセットでトレーニングされたディープ ラーニング アルゴリズムを使って医療画像を処理できるようにすることです。「AI の内部構造を理解するのは難しいことです。アルゴリズムの予測が正確だったとしても、なぜ正確だったのかは私たちにはわかりません。このため、医者も患者もその予測を信じていいかどうかわからないのです。ブラック ボックスのようなものですね」と話す Chung 氏は、医療分野で AI の精度と信頼度を高める鍵は透明性にあると考えています。
Chung 氏は、ワルシャワ大学計算生物学および機械学習グループの Lennart Brocki 氏とともに、Google Compute Engine の画像処理装置(GPU)を利用して大規模なモデル トレーニングと推論を実行するプロジェクトを立ち上げました。両氏は、腫瘍を正確に判別し、同時にその意思決定プロセスを説明できる AI ツールを開発しました。Google Colab を使って、アイデアの小規模なプロトタイプ作成やテストを短時間で行っています。「導入の障壁が低い点がすばらしいです。オーバーヘッド コストを削減できるほか、待ち時間もメンテナンスも不要ですから。さらに GPU 使用率を上げたり下げたりする柔軟性もあります。Google Research のクレジットは、新しいアイデアを試すうえで非常に有難いです」と、Chung 氏は述べています。
自然言語処理を使って患者とのコミュニケーションを分析
ライデン大学の CAIRELab(Clinical AI Implementation and Research Lab)での研究の一環として、van Buchem 氏は、自然言語処理ツールを応用して、病院へのクリニカル AI の導入を加速および拡大しています。現在取り組んでいるプロジェクトでは、危険な状態にある患者を特定してリソースを割くために、患者が生成したデータを活用する方法はないか検討しています。スタンフォード大学医科大学院 Boussard Lab での 6 か月の研究期間で、同氏は Tina Hernandez-Boussard 氏による監督の下、同僚の Anne de Hond 氏とともに、うつ病を発症する危険性があるがん患者を特定するパイロット プロジェクトを開始しました。同氏は治療プロセスを理解するために、ソーシャル ワーカー、がん専門医、精神科医に、それぞれが患者と関わるワークフローについて聞き取り調査を行いました。次に、Google Cloud のストレージとコンピューティング機能、およびオープンソースの Bidirectional Encoder Representations from Transformers(BERT)を使い、大規模言語モデルを一般公開データでトレーニングした後に微調整することで、スタンフォード大学の患者ポータルを通じて送信されたメッセージの中から、配慮が必要なものを特定できるようにしました。
van Buchem 氏のパイロット プロジェクトでは、配慮が必要なメッセージとそれ以外のメッセージをこのモデルで区別できることが確認されました。また、この結果は、複数の人口統計学的サブグループにわたり正確でした。「このプロジェクトをノートパソコンで実施していたら、数週間はかかっていたでしょう。Google Cloud 上では、事前トレーニングにかかった時間はたった数日でした。このスケールとスピードが大きなメリットです。より迅速なイテレーション、追加の GPU、メモリなど、必要なものすべてが 1 か所で利用できるのです」と同氏は話します。
医療の将来に関するビジョン
Chung 氏と van Buchem 氏は、それぞれのプロジェクトを引き続き改良して精度を高めながら、クラウド コンピューティングと AI によって医療研究と臨床診療が変革される未来を思い描いています。2 人に見えている未来では、クラウド コンピューティングによって、世界中の研究者がデータとリソースにアクセスできるようになっています。また、AI によって患者一人ひとりに合わせた治療やより良いサポートが可能になり、予後が改善されています。そして、ビッグデータから得られた分析情報を、医療従事者がそれぞれの重要任務に活用できています。van Buchem 氏は最後に次のように述べました。「使われないままのマルチモーダル データが膨大にあります。このデータを活用することで、医療従事者の管理上の負担の削減、診断精度の向上、病院内でのフローの改善が期待できます。」
高等教育機関で生成 AI の使用を開始する方法についてご関心をお持ちの方は、公共部門向けの新しい 10 ステップのガイドをダウンロードしてご確認ください。各分野のユースケースや、教育テクノロジーを革新している Varsity Tutors や IBL Education などの事例が掲載された、生成 AI の取り組みを開始するための包括的なガイドとなっています。
-Google Cloud、カスタマー エンジニアリング マネージャー Keith Binder