タンパク質フォールディングの解明を支援: AlphaFold 推論を利用しやすく
Google Cloud Japan Team
※この投稿は米国時間 2024 年 3 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
オープンソース ツールである Vertex AI AlphaFold Inference Pipeline は、バイオテクノロジー企業によるタンパク質フォールディングの研究を合理化させ、市場投入までのタイムラインを短縮することを可能にしました。このツールは並列処理の力を引き出し、コンピューティング リソースを最適化して、スケーリングにより高スループットの要求に対応することで、タンパク質構造予測の主要な課題に対処します。さらに、再現性、リネージ解析、柔軟性、適応性、アップストリーム システムとダウンストリーム システムのシームレスな統合を、すべて Vertex AI をワンストップ プラットフォームとすることで実現しています。このツールを使用して、研究者は新たな可能性を切り開き、画期的な発見をこれまでよりも迅速に成し遂げて、バイオテクノロジーによる創薬の取り組みをエンドツーエンドで効率化できます。
Google Cloud は、AlphaFold のアルゴリズムをバイオテクノロジー企業が利用しやすくするため尽力してきたものの、多くのバイオサイエンス機関にとっては、このテクノロジーをシームレスに研究者のワークフローに統合することが難しいのが現状です。
最大の課題は、タンパク質の形状で頭がいっぱいになっている科学者は、コーディングやクラウドの達人ではないことです。タンパク質の様子を見るためだけに科学者が複雑な設定と悪戦苦闘するよう求めるのは、シェフが料理を始める前にオーブンを一から組み立てるのを期待するようなものです。成功(あるいは美味しい料理)のための最適解とは言えません。
ソリューションの概要
こうした非効率性を低減するため、Google は、初心者のためのタンパク質モデリングともいえるユーザーフレンドリーな AlphaFold Portal を導入などして、Vertex AI AlphaFold Inference Pipeline を使いやすくしています。クラウド コンピューティングの使用経験にかかわらず、科学者は最小限の労力でタンパク質の構造を割り出すことができます。ポータルがあれば複雑なコーディング作業(Jupyter ノートブックで Python を記述するなど)に関わる必要がなくなり、ユーザーはタンパク質の推論結果の反復処理に集中できます。
このたび、Google Cloud AlphaFold のリポジトリに、このサーバーレスなポータルをデプロイするオプションが新たに追加され、安全かつ合理化された一元的な方法でタンパク質フォールディングの実験を管理できるようになりました。ワンクリックで新しい実験を開始し、ワークフローを簡素化して貴重な時間を節約できます。
一元化されたパイプライン
ポータルは、以下のような方法で研究者の仕事を効率化します。
- 一元化されたアクセス: 複数の研究者が 1 つのウェブアドレスからポータルにアクセスできるため、各自が Jupyter ノートブックのインスタンスを実行したり、プロジェクトごとにインフラストラクチャをデプロイしたりする必要がありません。
- 合理化されたタンパク質フォールディング: 研究者は、タンパク質フォールディングのパイプライン ジョブを自分のユーザー名で実行し、他の研究者の作業に基づいてシミュレーションの結果をフィルタリングできます。これにより、比較と微調整が容易になります。
- コラボレーションの強化: 以前は、研究者はタンパク質フォールディング ジョブそれぞれについて独自の Jupyter ノートブック インスタンスを実行する必要がありました。現在は、一元管理されたシミュレーション結果にアクセスして比較することで、簡単にコラボレーションできるようになりました。
1- AlphaFold Portal のダッシュボード
このダッシュボードは、タンパク質フォールディング研究の一元的なハブであると考えてください。ユーザーは表示をカスタマイズして、結果を効果的にフィルタリングし、指定されたリンクボタンを活用してタンパク質のリソースに直接アクセスできます。これにより、求められる複雑な構成や実行手順がシンプルになりました。
タンパク質フォールディングに取り組む準備ができたら、たった 2 回クリックするだけで、配列(FASTA 形式)の生成およびシミュレーションが実施されます。対象のタンパク質の種類と大きさに基づいて、推奨される最適な GPU マシン構成を UI が自動的に選択します。もし提案された設定を変更したい場合は、高度な設定を開いて、必要な仕様に応じてカスタマイズすることもできます。
2 - 新しいタンパク質フォールディング
さらに、Google はタンパク質モデルのプレビュー機能を統合しました。オープンソースの可視化ツールを活用して、同じインターフェースを使って複雑な分子構造をシームレスに調査できます。
3 - タンパク質構造の可視化
このツールを使えば、バイオテクノロジー企業の誰もが、クラウドやコーディングの経験に関わらずタンパク質フォールディングの力を活用できます。この非常に複雑でコンピューティング負荷の高いワークロードは、合理的かつ最適化されたインフラストラクチャ上でシームレスに実行され、効率性と使いやすさを保証します。
使ってみる
Google Cloud を初めてご利用の方も、心配ありません。ぜひスタートガイドのページをご覧になり、Google Cloud についての理解を深めてください。次に、あらゆるタンパク質フォールディングの魔法を格納するためのプロジェクトを作成して、しましょう。
オープンソースの Google Cloud AlphaFold リポジトリ(こちらのリンクからアクセスできます)で提供されている案内に沿って、次の手順に進んでください。このリポジトリには、便利な事前構築済みのテンプレートが含まれており、すべての必要なコンポーネントを設定するのに役立ちます。このプロセスには、ある程度の専門知識が必要です。課題に直面や、ガイダンスが必要な場合は、GCP の専任担当者が複雑なクラウドを操作するお手伝いをします。
ー Google Cloud、ソリューション アーキテクト Yudy Hendry
ー ML 担当カスタマー エンジニア Alfonso Miranda