Public Sector

簡素化されたチャージバックを使用した安全、スケーラブル、検出可能な研究環境

007-GBH-ResearchSection (1).png

※この投稿は米国時間 2022 年 6 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。

医療データは急激に増加しており、現在、世界のデータの 30% を占めると推定されています1。作成されるデータの量、スピード、種類により、研究者や学術関係者が大規模に分析情報を消費、分析、共有することはかなり困難です。Google Cloud では、研究者がより効率的にデータを共有し、リソースをプロビジョニングするために、スケーラブルで安全な医療研究の場を提供できるよう支援しています。

Google Cloud でデータ共有とクラウド リソースを加速

Google Cloud を使用すると、研究者は GPU やカスタム Google Cloud TPU を含む幅広いコンピューティング処理ユニットをリクエストしながら、ゼロから数千の同時実行仮想マシンをスケールアップまたはスケールダウンして、機械学習ワークロードを迅速化できます。

また、Google Cloud は、非構造化、半構造化、構造化のデータセットを含む、多様性に富んだデータを処理できます。基盤となるストレージはペタバイト規模でのスケーリングが可能で、さまざまなデータ モダリティをサポートし、Python と R プログラミング言語を搭載した Jupyter ノートブックや、安全な環境内に組み込まれた R Studio IDE などのツールを使用して Google Cloud の研究環境から直接アクセスできます。  

カナダの研究者がカナダ政府のクラウド運用化フレームワークを遵守できるようにするために、Google はクラウド環境におけるコントロールの暫定的で安全なベースライン セットを実装するガードレールを、検証プロセスを加速化させるためのガードレール検証ツールとともに作成しました。特に、医療データはカナダでは多くのプライバシーに関する法律や規制によって保護されており、Google はデータ保護機能について解説したホワイトペーパーを公開しています。データ保護機能を多くのセキュリティやプライバシー保護の取り組みに対応させつつ PHIPA を遵守する仕組みについても解説しています。

安全な基盤に加えて、医療業界の研究者はクラウドのリソース消費量の料金を請求するための安全なチャージバック(代金請求の差し戻し)機能を必要とすることがよくあります。Google Cloud はチャージバックを簡素化し、請求書発行やお支払い方法の取り扱いに関する潜在的な問題をなくしました。

チャージバックの簡略化を核とした医学情報学のための安全な研究環境の構築

トロント大学の Temerty Centre for Artificial Intelligence Research and Education in Medicine(T-CAIREM)が医療データを使用してコラボレーションを促進するためのデジタル環境を構築しようとしたとき、次のようないくつかの厳しい要件がありました。

  • 組み込み型セーフガードの実装

  • リージョン指定

  • エンドユーザーへの請求書発行とチャージバックの撤廃

  • Terraform を使用した繰り返し可能なデプロイ

一見すると、どのクラウド サービス プロバイダもこれらの要件に対処できそうですが、詳しく見ていくと、Google Cloud にはさらに次のようないくつかのメリットがありました。

チャージバックの簡素化とクラウド消費コストの把握

よく使用されるデータセットでは、クラウドのリソース消費量について、チャージバックの仕組みを介して外部の研究者へ請求する必要が生じることがあります。チャージバックは、支払い方法の取り扱いや請求書の必要性など、支払い方法の安全を保つうえで問題が生じる可能性があります。Google Cloud は、お支払いプロファイルを Google Cloud 請求先アカウントの外部に作成することで、チャージバックのプロセスを簡素化しています。お支払いプロファイルは Google Cloud で管理され、クライアントのクラウド組織に依存しないため、研究者は研究環境にログインする前にお支払いプロファイルを作成できます。また、クラウドの消費コストの閲覧可能ユーザーや配分された資金の追跡方法をエンドユーザー自身で管理でき、研究プラットフォーム プロバイダによる追加管理が不要です。 

Overview Cloud Billing Concepts
Cloud Billing コンセプトの概要からの画像リファレンス

また、高度な費用管理で過大請求を避けるために、研究者が自動的に請求を停止できるチュートリアルも作成しました。プログラムによる予算通知を使用すると、費用の自動モニタリングとコントロールによってプロジェクト費用に上限が設定されるなど、Google Cloud Billing が予算を超過することのないようユーザーを支援します。

組み込み型セーフガード: セキュリティ保護されたノートブック ブループリント

セキュリティを強化するために、Google はセキュリティ保護されたノートブック ブループリントを使用して安全なサービス境界を構築します(下図参照)。詳細については、Vertex AI Workbench ユーザー管理ノートブックでの機密データの保護をご覧ください。

Secure Service Perimeter (in Vertex AI Workbench user-managed notebooks)

サービス境界により、データの引き出しの軽減を目的とした、より高い信頼性の境界と関連するセキュリティ ポリシーが定義されます。サービス境界は、安全なクラウド基盤の一部として VPC Service Controls 内で定義され、信頼境界内にある Google Cloud プロジェクトとサービスの外枠を示します。詳細は、本ブログ内の機密データの保護をご覧ください。VPC Service Controls は、境界外のリソースへのデータの読み取りやコピーを防止します。

さらに、Google Cloud のゼロトラスト モデルである BeyondCorp により十分に定義されたクライアント属性に基づいて、信頼できるクラウド境界の外側にあるワークステーションにアクセスを許可するように、コンテキストアウェア アクセスを構成できます。また、個々の研究者を単一の境界に関連付けることもできるため、Google Cloud リソース間の通信を可能にする境界ブリッジを通じて研究者間のデータ共有を実現できます。

安全でスケーラブルなデータ環境: Health Data Nexus

Google Cloud 上に構築された T-CAIREM の Health Data Nexus は、より安全でスケーラブルなプラットフォームとセルフサービスのインターフェースを研究者に提供します。これにより、世界中のどこからでも目的のデータを読み込み、Jupyter ノートブックや R Studio でデータを分析し、情報を共有し、シームレスにコラボレーションを実行できます。この医療プラットフォームから発展させることができるプロジェクトは無限です。 

Google Cloud は、カナダの公共部門の組織ではすでに広く利用されており、世界的にも研究用のプラットフォームとして最も好まれていると Ipsos は報告しています

Google Cloud は、新たな進歩を生み出す研究者の取り組みをサポートすることに尽力しています。研究者が Google Cloud のトレーニングやリソースを使って研究を加速させる方法の詳細や、無料クレジットの申請については、研究者向け Google Cloud のページをご覧ください。

1 出典: https://www.rbccm.com/en/gib/healthcare/episode/the_healthcare_data_explosion

- トロント大学医学部 Temerty AI 研究教育センター、小児保健評価科学およびインフラストラクチャ共同リード Alistair Johnson 氏
- Google Cloud 医療および教育担当カスタマー エンジニア Mohamed Nofal