臨床ワークフローへの MedGemma の統合が簡単に

Fereshteh Mahvar
Software Engineer
※この投稿は米国時間 2025 年 12 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。
Google Heath AI Developer Foundations チームは、今年 5 月に MedGemma を発表し、その後 7 月に、270 億パラメータのマルチモーダル バリアントと MedGemma のビジョン エンコーダである MedSigLIP を発表しました。MedGemma が学界や業界で生み出してきた多種多様なモデル改変、研究論文、アプリケーションに、私たちは謙虚な気持ちで向き合ってきました。
私たちの目標は、研究、開発、臨床統合の過程のあらゆる局面でお客様のニーズに対応することです。初期のリリースでは、シンプルさを優先し、JPEG や PNG などの非医療用画像形式からデコードされたピクセルを基に画像プロンプトを構築し、医療記録のスニペットを JSON 形式または書式なしテキストとしてモデルに読み込んでいました。
しかし、MedGemma を相互運用可能な方法で臨床ワークフローに統合することの難しさも認識しています。そのため、臨床ワークフローへの統合には、Digital Imaging and Communications in Medicine(DICOM)や Fast Healthcare Interoperability Resources(FHIR)などの標準プロトコルが不可欠です。このたび、これらのデータ形式を扱うデベロッパーの作業を簡素化する機能が追加されたことをお知らせいたします。
DICOMweb の統合
DICOMweb リンクとして医療画像を受けとることができる MedGemma の新しい Docker コンテナをリリースします。
この新しい Docker コンテナまたはソースコードを直接使用することで、DICOM 対応の MedGemma サービスを任意のコンピューティング プラットフォームにデプロイできます。また、Cloud DICOM Store にデータを保存している Google Cloud Platform(GCP)ユーザーの方であれば、この投稿の「利用開始」セクションにアクセスすれば、Vertex Model Garden の事前構築済みリソースを使用して数分で運用を開始していただけます。
MedSigLIP コンテナは、当初から DICOM をネイティブに理解しています。詳しくは公開コンテナ、コンテナのソースコード、API 仕様をご覧ください。
デジタル病理学の Whole Slide Imaging(WSI)や、コンピュータ断層撮影(CT)や磁気共鳴画像法(MRI)といった多次元放射線画像など、複雑なモダリティを処理する必要があるインタラクティブなユーザー向けアプリケーションでは、サーバーサイドで画像を読み取ることでネットワーク パフォーマンスが最適化され、API ペイロードの制限を回避できます。さらに、このアーキテクチャはデータ転送中のセキュリティを強化し、一貫性のある決定論的なデータの前処理を保証します。


なお、Model Garden では現在、固定された構成でモデルとそのカスタム コンテナを Vertex オンライン推論エンドポイントにデプロイしていますが、GCP ユーザーであれば、Model Garden を通じたデプロイ以外の方法も利用可能です。デプロイ オプションについては、サービング アーキテクチャのドキュメントをご覧ください。
FHIR ナビゲーション エージェントのデモ
Google の FHIR 統合アプローチでは、MedGemma と GCP FHIR ストアをエージェント向けの実行可能なツールとして構成しています。デモでは、エージェントが患者の FHIR 履歴全体を MedGemma のコンテキスト ウィンドウに読み込むことなく、患者のすべての医療記録を必要とするプロンプトを作成する方法をお見せします。MedGemma が FHIR 標準を理解していることを活かし、患者データをインテリジェントにナビゲートする仕組みです。ここでは、人気のあるエージェント フレームワークである LangGraph を使用した実装方法を紹介しますが、GCP の Agent Development Kit(ADK)を含む他のエージェント フレームワークでも同じことが可能です。この投稿の「利用開始」セクションにアクセスして、エージェントが患者データをインテリジェントにナビゲートする方法をご覧ください。
利用開始
-
DICOM 対応の MedGemma については、Model Garden のモデルから開始し、新しいプルダウン オプションを使用して 4B または 27B のバリアントをデプロイします。デプロイが完了したら、このチュートリアル ノートブックを使用して、画像ピクセルではなく医療画像へのリンクでモデルにプロンプトを与える方法を確認します。




次のステップ
LLM を使用して複雑なマルチステップ タスクを実行するシステムとして、高度なエージェント ソリューションを構築する場合は、Model Context Protocol(MCP)を利用すると、必要なすべてのコンテキストとデータを確実に管理、配信できます。GCP で MCP を活用するには、オープンソースのデータベース向け MCP ツールボックスと、GCP Healthcare API との統合を利用する必要があります。医療画像処理に取り組んでいる場合は、新しい DICOM 対応の MedGemma を使用して、MCP 構成でより効率的なサーバーサイドの DICOM 処理を実現することで、エージェント アプリケーション用の臨床コンテキストの準備を高速化できます。
リソースとサポート
Google の使命は、お客様の成功を支援することです。Google のチームやコミュニティと交流する最善の方法は次のとおりです。
-
HAI-DEF デベロッパー フォーラムでテクニカル サポートを求める。
-
フィードバック フォームからユースケースを共有して、Google のロードマップの策定に協力する。これにより、Google のエンジニアリングの取り組みを業界で最も一般的なニーズに合わせることができます。
-
ニュースレターに登録して、新しいツールやモデルに関する最新情報を入手する。
-
Google が提供するすべてのリソースにアクセスできるワンストップ ショップである goo.gle/hai-def をブックマークする。
この投稿には、ソフトウェア エンジニアの Liron Yatziv、Kenneth Philbrick、Bram Sterling、Tiffany Chen、Can Kirmizi も貢献しています。
-ソフトウェア エンジニア、Fereshteh Mahvar



