コンテンツに移動
Healthcare & Life Sciences

MedLM で拡張された臨床ナレッジグラフを使用して臨床インテリジェンス エンジンを構築

2024年2月2日
Google Cloud Japan Team

Try Gemini 1.5 Pro

Google's most advanced multimodal model in Vertex AI

Try it

※この投稿は米国時間 2024 年 1 月 24 日に、Google Cloud blog に投稿されたものの抄訳です。

AI は、患者データと医療情報を統合して価値あるインサイトを提供することで、臨床医を支援できる大きな可能性を秘めています。Google は、AI が臨床医コミュニティにもたらすメリットについて理解しており、このたび、インド最大のマルチチャンネル デジタル ヘルスケア プラットフォームである Apollo 24|7 と協力して、臨床インテリジェンス エンジン(CIE)を構築しました。この CIE を使用すると、数百万もの匿名化された臨床インタラクション データポイントでキャプチャした豊富な情報から、根拠に基づくインサイトを生成できます。このソリューションは、臨床医が自身の能力を強化し、患者により優れた治療を提供できるように支援するための補助ツールとして設計されています。

Apollo 24|7 のソリューションにはさまざまなアプローチが含まれており、Google が新たにリリースした MedLM の一部となった Med-PaLM 2 や、臨床ナレッジグラフをベースとしたモデルも使用されています。

使用したデータセット

MIMIC IV データセットを使用しました。これは一般公開されている電子医療記録データセットで、フリーテキストの退院記録も含まれています。

評価指標

テストの評価に使用した 3 つの主な指標は次のとおりです。

  1. Top-K の調整済み MAP: Recommender のようなシステムを評価するために、上位 K 個の候補の平均適合率(MAP)を計算します。最大 K 個の値それぞれの平均適合率を反復処理で計算します。
  2. 適合率スコア: この指標によって、真陽性と比較して、予測に存在する偽陽性の数を判断しやすくなります。
  3. キャプチャ率: この指標によって、グラウンド トゥルースに実際に存在する値のうちモデルで正確に特定された値の数を経験的に判断しやすくなります。いわば、これは再現率に似ています。

テスト

MedLM と呼ばれる Google Research の大規模言語モデル(LLM)から、Personalized PageRank などのグラフモデルや、kNN(k 最近傍)モデル、Two-Tower モデルといった従来のモデルまで、さまざまなモデルでテストを実施しました。

このブログでは、MedLM によって拡張された Personalized PageRank を使用したアプローチについて説明します。

ステップ 1: 臨床ナレッジグラフを構築する

  • グラフ データベースである Neo4j で、包括的な臨床ナレッジグラフを構築しました。
  • まず、Google の PaLM 2 モデルと Vertex Healthcare Natural Language API を使用して、退院記録の形式をとった非構造化医療テキストから医療コンセプトを抽出します。

これらの臨床エンティティには、投薬、投与量、投与頻度、投与期間、症状が含まれます。これらのエンティティをリンクして、適切な関係を作成します。抽出したエンティティは、グラフ データベースとして Neo4j に取り込まれます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Clinical_knowledge_graph.max-2000x2000.png

Fig 1: Clinical knowledge graph

  • 「入院」と「UMLS」の 2 種類のノードだけを持つ二部ナレッジグラフを作成します。UMLS(統一医学用語システム)コードは、Healthcare NL API のレスポンスによって生成されます。
  • エンティティのコンテキストを維持するために、退院サマリーからセクション(「症状」、「アレルギー」、「病歴」など)を抽出します。薬剤「パラセタモール」が「投薬」セクションと「アレルギー」セクションに存在することは、UMLS コードが同じでも 2 つの異なるものであることを示しています。そこで、UMLS と Section(セクション)を組み合わせた中間ノード「SUMLS」を作成しました。
https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Section_Details_in_clinical_knowledge_gr.max-2000x2000.png

Fig 2: Section Details in clinical knowledge graph

このナレッジグラフを作成したうえで、さまざまなグラフ アルゴリズムでテストを実施しました。

ステップ 2: GraphSage と Optuna の最適化を使用して Personalized PageRank モデルを構築する

  • Neo4j で作成した臨床ナレッジグラフに基づいて、PageRank ベースライン モデルを構築しました。
  • ノード属性を考慮するために、ノード エンベディングを使用して近接ベクターで類似ノードを表し、kNN アルゴリズムを使用して類似性の高い上位 10 件の入院を関連付けました。
  • 利用率の高いノードのエッジについては、混雑の影響を軽減するために、利用率に基づいて重みを軽くしました。
  • 次に、GraphSage モデルをトレーニングして、二部ナレッジグラフに存在するノードの近接エンベディングを作成しました。
  • エッジの重みを最適化するために、Optuna を使用しました。

ステップ 3: MedLM によって結果を拡張する

MedLM は、Google の MedLM の機能を活用しています。また、医療分野向けに調整されており、医療に関する質問に対してより正確な回答を提供します。さらに、有益で充実したディスカッションの促進、医療に関する複雑な質問への回答、複雑な非構造化医療テキストでのインサイトの発見に活用できます。ほかにも、短い回答と長い回答の作成、内部のデータセットや科学知識体系から得たドキュメントやインサイトの要約に役立てることができます。

Google が行ったテストでは、Personalized PageRank モデルの出力を MedLM にコンテキストとしてフィードして、最終的な回答を生成することによって、精度を高めることができました。

MedLM と臨床ナレッジグラフを使用したこのアプローチによって生成された最終的な回答が事実に基づいていることが確認され、偽陽性を削減し、真陽性を増加させることでさらに精度が上がることがわかりました。

「臨床ナレッジグラフと MedLM による拡張を基盤として構築されたこのソリューションは、患者の病歴を分析して、関連する投薬、検査結果、治療内容、考えられる診断に対するインサイトを生成して臨床医が確認できるようにします。このような根拠に基づくインサイトを生成することで、この生成 AI ソリューションは、臨床ワークフローの強化、エラーの削減、患者の転帰の改善を目指しています。また、非常に強力であるとともに、常に臨床医を補助する AI の機能に関して、これはほんの一例であると理解しておくことがきわめて重要です」と、Apollo 24|7 のエンジニアリング リードである Abdussamad M 氏は述べています。

このソリューションは、臨床医の専門知識に置き換わることではなく、臨床医のスキルと経験を増強することを目的としています。

Google Cloud コンサルティング(GCC)によるエンドツーエンドの迅速な導入

Google Cloud と Apollo 24|7 のパートナーシップは、組織が望ましい成果を上げられるよう支援するために、複雑な問題を解決する AI 搭載ソリューションを提供している最新の例のひとつです。Apollo は Google Cloud コンサルティング(GCC)の協力の下、繰り返しのイテレーションとテストを実施し、最終的なソリューションを構築できました。そして、これはビジネスの強化につながっています。GCC は Apollo から、Apollo チームと共同でビジネス要件に合わせてワークフローの環境を構築することを託されました。GCC ポートフォリオは、さまざまなサービスやプロダクトを 1 つに統合し、複数の専門分野にまたがるさまざまなサービスを 1 か所にまとめて提供します。学習サービス、テクニカル アカウント マネジメント、プロフェッショナル サービス、カスタマー サクセスなど、Google Cloud コンサルティング サービスの具体的なサービスの全ポートフォリオはこちらでご確認いただけます。


免責条項: MedLM はインドではまだプレビュー段階であり、本番環境での使用は承認されていません。

  • Apollo 24|7、クリニカル AI プロダクト責任者 Chaitanya Bharadwaj 氏
  • Google Cloud、AI プログラム リード Sharmila Devi
投稿先