AI & 機械学習

マックスプランク研究所がマルチモーダルエージェントを通じて専門スキルを共有する方法

2025年11月19日

https://storage.googleapis.com/gweb-cloudblog-publish/images/Planck-Institute-Research-AI-Agent-Hero.max-1400x1400.png

Dr. Patricia Skowronek

Post-doctoral researcher, Max-Planck-Institute for Biochemistry

Anant Nawalgaria

Sr. Staff ML Engineer & PM, Google Cloud

※この投稿は米国時間 2025 年 10 月 25 日に、Google Cloud blog に投稿されたものの抄訳です。

がんやアルツハイマー病などの複雑な病気の効果的なモニタリングと治療は、その根底にある生物学的プロセスを理解することにかかっています。タンパク質は、そのプロセスに不可欠なものです。質量分析ベースのプロテオミクスは、これらのタンパク質を迅速かつグローバルに研究するための強力な手法です。しかし、この手法を広く採用するには、技術的な複雑さがネックとなっています。高度な分析機器と手順を習得するには専門的なトレーニングが必要となるためです。これにより、専門知識のボトルネックが生じ、研究の進展が遅くなります。

この課題に対処するため、マックスプランク生化学研究所の研究者は Google Cloud と協力して、科学者の実験を支援する Proteomics Lab Agent を構築しました。このエージェントは、パーソナライズされた AI ガイダンスを通じて複雑な科学的手順の遂行を簡素化し、実行を容易にすると同時に、プロセスを自動的に文書化します。

「研究室の重要な専門知識は、文書化されることがほとんどなく、研究者の異動によって失われる暗黙知であることがよくあります。このエージェントは、実践的な演習を記録して組織の記憶を構築するだけでなく、実験エラーを体系的に検出して再現性を高めることで、この問題に直接対処します。最終的には、研究室がこれまで以上に迅速に科学のフロンティアを押し広げられるようになります」と、マックスプランク生化学研究所のプロテオミクスおよびシグナル伝達部門を率いる、質量分析ベースのプロテオミクスのパイオニアである Matthias Mann 教授は述べています。

このエージェントは、Agent Development Kit（ADK）、Google Cloud インフラストラクチャ、Gemini モデルを使用して構築されました。Gemini モデルは、高度な動画と長いコンテキストを理解でき、高度な研究のニーズに最適です。

エージェントのコア機能の一つは、研究者が実験作業を行う動画を分析し、その行動を基準プロトコルと比較することで、エラーや漏れを検出することです。このプロセスは 2 分強で完了し、手順上のエラーを約 74% の高い精度で検出できます。ただし、ドメイン固有の知識と空間認識にはまだ改善が必要です。AI による支援を受けたアプローチは、現在の手動によるアプローチよりも効率的です。手動によるアプローチでは、研究者の直感に頼って、手順中の微妙な間違いを見つけたり、さらによくあるケースでは実験が失敗した後にのみトラブルシューティングを行ったりします。

エージェントは、ミスを特定しやすくし、パーソナライズされたガイダンスを提供することで、トラブルシューティングの時間を短縮し、将来的にはリアルタイムの AI ガイダンスがエラーの発生を防止することを目指しています。

プロテオミクス AI エージェントの可能性はライフサイエンスの分野にとどまらず、専門分野における普遍的な課題、つまりマニュアルからではなく実践を通じて習得する専門知識を捕捉して伝達するという課題に対処します。他の研究者や組織がこのコンセプトをそれぞれの分野に適用できるように、このエージェントフレームワークは GitHub でオープンソースプロジェクトとして公開されています。

この投稿では、Proteomics Lab Agent のエージェントフレームワーク、マルチモーダル AI を使用してパーソナライズされたラボガイダンスを提供する仕組み、実際の研究環境にデプロイした結果について詳しく説明します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_04JTJc5.max-1300x1300.jpg

Proteomics Lab Agent がプロトコルを生成し、エラーを検出

課題: 離職率の高い環境で専門知識を維持する

金曜日の夕方、研究室にいると想像してください。新米研究者は高度な分析機器である質量分析計を使用する必要がありますが、その責任者である上級専門家は週末のためすでに帰宅しています。研究者は、長いプロトコル内を検索し、さまざまな指標に反映される複数の要因に依存する機器のパフォーマンスを解釈し、ガイダンスなしに作業を進める必要があります。たった 1 つのミスで、高価な機器が損傷したり、貴重なサンプルが無駄になったり、研究全体が台無しになったりする可能性があります。

このような複雑さは、質量分析ベースのプロテオミクスなどの専門的な研究分野ではよくあるハードルです。科学の進歩は、高度な技術的専門知識を必要とする複雑な手法や機器に依存することがよくあります。特に学術機関では離職率が高いため、研究室は人材のトレーニング、手順の文書化、知識の保持において大きなボトルネックに直面しています。専門家が退職すると、蓄積された知識も一緒に失われることが多く、チームは部分的にやり直さざるを得なくなります。このようなことが積み重なってアクセシビリティと再現性の課題が生じ、新たな発見が遅れてしまいます。

解決策: ラボのガイダンスのための AI エージェント

プロテオミクスラボエージェントは、プロトコルや機器データから過去のトラブルシューティングの決定まで、ラボの集合知に直接接続することで、これらの課題に対処します。これにより、研究者は実験ワークフロー全体にわたる複雑な手順について、パーソナライズされた AI ガイダンスを利用できます。たとえば、ピペッティングなどの通常のウェットラボ作業や、質量分析計の操作に必要な特殊な機器やソフトウェアとのやり取りなどです。エージェントのもう一つの機能は、実験の動画から詳細なプロトコルを自動的に生成し、手順のエラーを検出して、修正のためのガイダンスを提供できることです。これにより、トラブルシューティングとドキュメント作成の時間を短縮できます。

ラボ向けの AI エージェントアーキテクチャ

基盤となるマルチモーダルエージェント AI フレームワークは、図 1 に示すように、複数の専門的なサブエージェントの作業を調整するメインエージェントを使用します。Gemini モデルと Agent Development Kit を使用して構築されたこのメインエージェントは、オーケストレーターとして機能します。研究者のクエリを受け取り、リクエストを解釈して、適切なサブエージェントにタスクを委任します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1-Fig1.max-1800x1800.png

図 1: マルチモーダルガイダンスのための Proteomics Lab Agent のアーキテクチャ。

サブエージェントは特定の機能向けに設計されており、ラボの既存のナレッジシステムに接続します。

Lab Note Agent、Protocol Agent: 動画関連のタスクを処理します。研究者が実験の動画を提供すると、これらのエージェントは動画を Google Cloud Storage にアップロードし、動画の視覚コンテンツと音声コンテンツを分析できるようにします。その後、エージェントはエラーがないか確認したり、新しいプロトコルを生成したりできます。
Lab Knowledge Agent: 研究所のナレッジベース（MCP Confluence）に接続して、プロトコルを取得したり、新しいラボノートを保存したりします。これにより、チーム全体が知識にアクセスできるようになります。
Instrument Agent: 複雑な分析機器の使用に関するガイダンスを提供するために、研究所の質量分析計をモニタリングする自社構築の MCP サーバー（MCP AlphaKraken）から機器のパフォーマンス指標を取得します。
Quality Control Memory Agent: すべての機器関連の決定とその結果をデータベース（MCP BigQuery など）に保存します。これにより、過去にうまくいったことの検索可能な履歴が作成され、貴重なトラブルシューティングの経験が保存されます。

これらのエージェントを組み合わせることで、現在の機器の状態や研究者の経験レベルに合わせたガイダンスを提供し、研究者の経験を自動的に文書化できます。

詳細: 動画分析で実験エラーを検出

生成 AI は、文献分析からコードによるラボロボットの制御まで、科学分野のデジタルタスクに効果的であることが証明されていますが、デジタル支援と実際のラボでの作業の間の重要なギャップにはまだ対処していません。この研究では、動画から実験ノートを自動生成し、実験エラーを検出することで、このギャップを埋める方法を示しています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2-Fig2.max-2200x2200.png

図 2: 動画ベースのラボノート生成とエラー検出のエージェントワークフロー。

図 2 に示すプロセスは、いくつかのステップで展開されます。

研究者は実験を録画し、「この動画から実験ノートを作成して、間違いがないか確認してください」のようなプロンプトとともに動画をエージェントに送信します。
メインエージェントは、タスクを Lab Note Agent に委任します。Lab Note Agent は、動画を Google Cloud Storage にアップロードし、動画で行われたアクションを分析します。
メインエージェントは、Lab Knowledge Agent に、これらのアクションに一致するプロトコルを見つけるよう依頼します。Lab Knowledge Agent は、ラボのナレッジベースである Confluence からその情報を取得します。
動画分析とベースラインプロトコルの両方で、タスクは再び Lab Note Agent に渡されます。このエージェントは、動画とプロトコルをステップごとに比較する方法を知っています。手順の漏れ、誤った操作、プロトコルにない手順の追加、手順の順序の間違いなど、潜在的なミスを検出します。
メインエージェントは、生成されたラボノートを研究者に返します。その際、潜在的なエラーがフラグ付けされ、レビューできるようになっています。研究者はメモを承認するか、修正を加えることができます。
最終的に、修正されたメモは Lab Knowledge Agent を介して Confluence ナレッジベースに保存され、テストの完全かつ正確な記録が保持されます。

組織の記憶を構築する

Protocol Agent は、ラボがナレッジベースを構築するのを支援するために、動画からラボの手順を直接生成できます。研究者は、手順を声に出して説明しながら、自身が手順を実行する様子を録画できます。エージェントは動画と音声を分析して、書式設定された、公開可能なプロトコルを生成します。モデルに多様な例、段階的な指示、関連する背景ドキュメントを提供することで、最良の結果が得られることがわかりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3-Fig3.max-2200x2200.png

図 3: 機器の操作をガイドするエージェントのワークフロー。

エージェントは、機器の操作もサポートできます（図 3 を参照）。研究者が「サンプルを測定するために、機器 X の準備はできていますか？」と尋ねると、エージェントは、Instrument Agent を介して最新の機器指標を取得し、Quality Control Memory Agent からの過去のトラブルシューティングの決定と比較します。その後、「はい、機器は準備完了です」や「いいえ、まずキャリブレーションをおすすめします」などの推奨事項を提示します。Lab Knowledge Agent から関連するキャリブレーションプロトコルを提供することもできます。その後、Quality Control Memory Agent を使用して、研究者の最終的な決定とアクションを保存します。これにより、すべての推論とその結果が保存され、特殊な機器やソフトウェアを操作するための知識ベースが継続的に改善されます。

技術的な詳細については、完全版の論文をご覧ください。

現実世界への影響: 複雑な科学的手順を簡素化

AI エージェントの価値を実際の環境で測定するため、40 人の研究者が所属するマックスプランク生化学研究所の部門に AI エージェントを導入しました。エージェントのパフォーマンスは、手順のエラーの検出、プロトコルの生成、パーソナライズされたガイダンスの提供という 3 つの主要なラボ機能について評価しました。

その結果、スピードと品質の両方で大きな成果が得られました。主な調査結果は以下のとおりです。

AI によるエラー検出: 記録された 28 件のラボ手順を基準プロトコルと比較したところ、エージェントはすべての手順エラーの 74%（再現率と呼ばれる指標）を特定し、全体的な精度は 77% でした。現時点では精度（41%）がまだ課題ですが、結果は非常に有望です。
迅速かつ専門家レベルのプロトコル: 研究所の動画から、エージェントが標準化された、公開可能なプロトコルを約 2.6 分で生成しました。これは手動で作成するよりも約 10 倍速く、10 種類の多様なプロトコルで平均品質スコア 4.4（5 段階評価）を達成しました。
パーソナライズされたリアルタイムのサポート: エージェントは、リアルタイムの機器データと過去のパフォーマンスに関する意思決定を統合し、研究者に機器の使用に関するカスタマイズされたアドバイスを提供することに成功しました。

エラー検出の結果をさらに詳しく分析したところ、具体的な強みと改善すべき点が明らかになりました。図 4 に示すように、システムは一般的なラボ機器の認識と画面上のテキストの読み取りにすでに効果を発揮しています。主な制限は、高度に専門化されたプロテオミクス機器の理解（エラーのうち 27% は認識されなかった）と、96 ウェルグリッド上のピペットチップの正確な配置（47%）やピペット上の小さなテキスト（41%）などの詳細な情報の認識（対応する論文の付録を参照）でした。マルチモーダルモデルの進化に伴い、これらの詳細を解釈する能力が向上し、実験上のミスに対するこの重要な安全対策が強化されることが期待されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4-Fig4.max-2100x2100.png

図 4: ラボにおけるプロテオミクスラボエージェントの強みと現在の限界。

このエージェントはすでにドキュメントの自動化と録画された動画のエラーのフラグ付けを行っていますが、その将来の可能性は、単なる修正ではなく、予防にあります。音声を使用してリアルタイムで間違いを防止するインタラクティブなアシスタントを構想し、このプロジェクトをオープンソース化することで、コミュニティにこの未来の構築への協力を呼びかけています。

将来を見据えたスケーリング

結論として、このフレームワークは、再現性の危機から離職率の高い学術環境における知識の保持まで、現代科学における重要な課題に対処します。エージェントは、手順データだけでなく、その背後にある専門家の推論も体系的に取得することで、組織の記憶を構築します。

「このアプローチは、研究者が研究室を離れると失われがちな実践的な知識を捕捉して共有するのに役立ちます。蓄積された経験は、新しいチームメンバーのトレーニングを加速するだけでなく、質量分析計の予測機器メンテナンスや、個々のラボ内および別のラボ間での自動プロトコル調和といった将来のイノベーションに必要なデータ基盤を構築します」と、Matthias Mann 教授は述べています。

Proteomics Lab Agent の背後にある原則は、1 つの分野に限定されるものではありません。この調査で概説されているコンセプトは、ライフサイエンスから製造まで、複雑な実践手順に依存するあらゆる分野に適用できる一般的なソリューションです。

手法と結果について詳しくは、論文全文をご覧ください。GitHub でコードを調べ、Proteomics Lab Agent をご自身の調査に合わせて調整してください。マックスプランク研究所の Mann 研究室の今後の活動については、LinkedIn、BlueSky、X でご確認ください。

_{このプロジェクトは、マックスプランク生化学研究所と Google の共同研究です。コアチームのメンバーは、マックスプランク生化学研究所プロテオミクスおよびシグナル伝達部門の Patricia Skowronek 博士と Matthias Mann 教授、Google の Anant Nawalgaria です。また、サポートいただいた Mann 研究室の全員に感謝します。}

ーマックスプランク生化学研究所、博士研究員、Patricia Skowronek 博士

ー Google、シニアスタッフ ML エンジニア Anant Nawalgaria

投稿先