SandboxAQ: クラウド インテグレーションによる創薬の加速
Ruslan Mursalzade
Product Marketing Lead, Google Cloud AI Infrastructure
※この投稿は米国時間 2025 年 4 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。
従来の創薬プロセスは、莫大な資本投資が必要で、開発期間が長期にわたり、高い失敗率に悩まされています。新薬を市場に出すには、初期の研究から規制当局の承認を得るまで、数十年かかることもあります。この期間中、非常に期待されていた新薬候補の多くが、効果が不十分であったり、安全性に関する懸念があるために失敗に終わります。臨床試験と規制上の課題を乗り越えることができる新薬候補は、ごく一部にすぎません。
そこでご紹介するのが、SandboxAQ です。SandboxAQ は、研究者が広大な化学空間を探索し、分子間相互作用に関する深い分析情報を引き出し、生物学的結果を正確に予測できるよう支援します。アクティブ ラーニング、絶対自由エネルギー摂動ソリューション(AQFEP)、生成 AI、構造解析、予測データ分析などの最先端のコンピューティング手法を活用して、最終的に創薬と医薬品開発のタイムラインを短縮します。そしてこれらすべてを、クラウドネイティブな基盤上で行います。
医薬品の設計は、分子の設計、合成、テストの反復サイクルである「設計 - 製造 - テスト」サイクルにより成り立っています。多くの顧客は、設計段階で SandboxAQ にアプローチします。そして多くの場合に、計算手法が機能していないという問題を抱えています。SandboxAQ は、設計サイクルのこの部分を改善し、加速させることで、医薬化学者が革新的で効果的な分子を市場に投入できるよう支援します。たとえば、神経変性疾患に関連するプロジェクトでは、SandboxAQ のアプローチにより化学空間が 25 万分子から 560 万分子に拡大し、ヒット率が 30 倍向上し、候補分子の発見が大幅に促進されました。


科学的知見のためのクラウド ネイティブ開発
SandboxAQ のソフトウェアは大規模なコンピューティングに依存しており、柔軟性とスケーラビリティを最大化するために、Google Cloud のインフラストラクチャとツールを含むクラウド戦略を採用しています。
大規模なバーチャル スクリーニング キャンペーンで使用するテクノロジーは、アジャイルで、費用対効果に優れたスケーリングが可能である必要があります。具体的には、SandboxAQ のエンジニアは、科学的なコードをすばやく反復処理し、そのコードを費用対効果に優れた方法で大規模に即座に実行し、生成されるすべてのデータを保存して整理しなければなりません。
SandboxAQ は、Google Cloud インフラストラクチャを使用することで、効率性とスケーラビリティの大幅な向上を実現しました。演算スループットを 100 倍スケールし、数万台の仮想マシン(VM)を並列で活用できるようになりました。また、アイドル時間を 90% 削減することで、利用率も向上させています。SandboxAQ は、Google Cloud で開発とデプロイを統合することで、コードの開発、テストから大規模なバッチ処理、そして ML モデルのトレーニングに至るまで、ワークフローを効率化しました。
SandboxAQ の開発とデプロイはすべてクラウド上で行われます。コードとデータはクラウドベースのサービスに保存され、開発はクラウドベースのプラットフォームで行われます。このプラットフォームは、科学者やエンジニアに、標準化され一元管理された環境とツールを備えたセルフサービス VM を提供します。これは重要な点といえます。なぜなら、科学的なコードには高い負荷に耐えられるコンピューティング ハードウェアが必要になることがよくあるからです。科学者は、96 コアの強力なマシンや、大規模な GPU を使用するインスタンスにアクセスできます。また、以下に示すように、別の構成や CPU タイプで新しいマシンを作成することもできます。これにより、異種リソース間でのスムーズなテストと開発プロセスが可能になります。


SandboxAQ の科学者と開発者は、同社の「bench」クライアントを使用して、Bench マシン(上の図を参照)を管理し、アクセスできます。SSH 経由でマシンに接続したり、即時にリモート デスクトップを提供するブラウザベースの VNC サービスや、JupyterLab による使い慣れたノートブック開発フローなど、さまざまな管理ツールを使用したりできます。
コードを大規模に実行する準備ができたら、研究者は Batch を活用した内部ツールに SandboxAQ のパラメータ化された計算セットをジョブとして送信できます。Batch は、Google インフラストラクチャでバッチジョブをスケジュールし、キューに入れ、実行するフルマネージド サービスです。開発環境とバッチ ランタイム環境が密接に同期しているため、変更を大規模にすばやく実行できます。また、Bench マシンで開発されたコードは GitHub に push され、すぐにバッチ実行に使用できます。その後、確認され、同社の monorepo の「main」に統合された新しいツールは SandboxAQ の科学者の Bench マシンで自動的に利用可能になります。科学者は、オンデマンド VM または Spot VM を利用し、任意のグローバル ゾーンにあるあらゆる種類の Google Cloud VM リソースで数百万個の分子を処理する並列ジョブを起動できます。
SandboxAQ のグローバルに解決された推移的な依存関係ツリーの実装により、パッケージと依存関係の管理が簡単に行えます。この手法では、Google Batch はエンジニアが開発した個々のツールとシームレスに統合し、モデルの多数のインスタンスを並行してトレーニングできます。
ML は SandoxAQ の戦略の中核的要素であり、容易なデータアクセスが特に重要です。一方で、SandboxAQ の創薬チームは機密データを扱うクライアントとも連携しています。顧客のデータを保護するために、Bench ワークロードと Batch ワークロードは、IAM により管理される統合インターフェースからデータを読み書きし、組織内のさまざまなデータソースに対するきめ細かい制御を可能にします。
また、Cloud Logging、Cloud Monitoring、Compute Engine、Cloud Run などの Google Cloud サービスにより、これらのワークロードをモニタリングし、SandboxAQ の科学者にログを簡単に表示し、膨大な量の出力データを精査するためのツールを簡単に開発できます。新機能のテストやバグの発見時には、インフラストラクチャに手を加えることなく、変更がすぐに科学チームに提供されます。コードが安定したら、それを Google Cloud 上の一元的に保護された統一的な方法で、ダウンストリームの本番環境アプリケーションに組み込むことができます。
つまり、Google Cloud 上に開発、バッチ コンピューティング、本番環境が統合されていることで、SandboxAQ は新しいワークロードを開発し、大規模に実行する際に直面する摩擦を減らすことができます。科学的なワークロードの開発とエンジニアリングのための共有環境を備えた SandboxAQ は、顧客が試験運用から本番環境に迅速かつ容易に移行できるようにし、顧客が求める結果をすばやく提供します。
SandboxAQ ソリューションの実際の活用
SandboxAQ は、治療が難しいさまざまな疾患を対象とした創薬プログラムにすでに大きな影響を与えています。たとえば、カリフォルニア大学サンフランシスコ校(UCSF)の Stanley Pruisner 教授の研究室、Riboscience、Sanofi、Michael J Fox Foundation などとの先進的な共同研究が挙げられます。この Google Cloud を基盤としたアプローチにより、SandboxAQ は高スループット スクリーニングなどの他の手法と比較して優れたヒット率を達成し、創薬における SandboxAQ の革新的な可能性を示しながら、患者に迅速な治療法を提供しています。
Google Cloud AI インフラストラクチャについて詳しくは、Google Cloud AI Hypercomputer のウェブページをご確認ください。
-Google Cloud AI Infrastructure、プロダクト マーケティング リード Ruslan Mursalzade