コンテンツに移動
Google Cloud

GCP 上の医療データ管理システムのための処方箋

2019年11月18日
https://storage.googleapis.com/gweb-cloudblog-publish/images/GCP_healthcare.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2019 年 11 月 5 日に、Google Cloud blog に投稿されたものの抄訳です。

他の多くの業界と同様、医療業界でも膨大な量のデータの保存、処理、分析などを行うためにクラウドベースのリソースが急速に導入されています。しかし、この複雑な業界向けにクラウドベースのソリューションを作成することはとりわけ難しいと感じている医療組織は少なくありません。

スケーラビリティと可用性の高いシステムを実装するという技術的な課題に加え、保護対象保健情報(PHI)をどのように処理するかも、医療ソリューションの重要な検討事項になります。世界各地の法令(米国の HIPAA など)では、患者情報の処理方法と保存方法が規定されています。さらに、医療組織にとって業界全体でデータを共有できることは重要ですが、組織で使用されるデータ形式とスキーマは多岐にわたります。そのため、さまざまなデータの種類を組み合わせる処理が複雑になる場合があります。

この課題に取り組むために、Google は一般的な医療データ形式(FHIR、HL7v2、DICOM など)を使用する、医療業界に特化したいくつものプロダクトを開発しました。また、Google Cloud Platform(GCP)での医療データ管理システムの把握と設計を容易にするために、医療業界において重要な問題に対処するソリューション ドキュメントをいくつか公開しました。各ドキュメントには、医療システムとデータを GCP に移行する方法に関する規範的なガイダンスとともに、医療ソリューションの実装時に発生する可能性のある問題の一部について、背景情報が記載されています。

医療ソリューションの構築

医療データ向けに GCP ベースのシステムを構築するには、多くのコンポーネントと流動的な要素が必要です。すべての要素を理解し自分で組み立てるには、時間がかかるうえに学習が欠かせません。特に重要なのは、データのプライバシーに関する問題に対応するために必要な管理機能が備わったシステムにすることです。

構築を始めていただけるよう、GCP Cloud Healthcare チームは Google Cloud Healthcare Data Protection Toolkit を作成しました。このツールキットは、順を追ってプロセスを説明し、多くの操作を実行する一連のスクリプトと手順で構成されおり、GCP GitHub リポジトリの Apache Licence Version 2 でオープンソース プロジェクトとしてご利用いただけます

GCP では、ツールキットを医療業界のコンテキストに関連付けて、医療システム全体にどう適用できるかを示すために、関連する 2 つのソリューションを公開しています。1 つは、Google Cloud ソリューション コンサルタントの Adrish Sannyasi による「アーキテクチャ: HIPAA 対応の Cloud Healthcare」です。このドキュメントでは、医療ソリューションの作成に固有の問題について背景を説明し、ツールキットと関連ソリューションで構築できるアーキテクチャを示しています。
https://storage.googleapis.com/gweb-cloudblog-publish/images/Architecture_HIPAA_aligned_Cloud_Healthcar.max-2000x2000_mVjb2by.png

ドキュメントで指摘されているとおり、これは本番環境に対応した最終的なシステムではなく、必要なコンポーネントと互いの関係を説明することを目的としたリファレンス アーキテクチャです。独自の要件と用途を組み込んだアーキテクチャを作成するためのベースとして使用することが前提となっています。

また、このドキュメントでは、完全な医療ソリューションのさまざまな面についても掘り下げています。セキュリティと権限、オンプレミス システムとの接続、ロギングとモニタリングについて、医療の問題に対応するシステム要件の観点から説明しています。

もう 1 つの関連ソリューション「HIPAA 対応プロジェクトの設定」もご利用いただけます。このドキュメントは、ツールキットを使用したリファレンス アーキテクチャのインスタンス構築について、詳細な手順を説明するものです。チュートリアルでは、新しいプロジェクトの作成から BigQuery ログのチェック、不審な操作のチェックに至るまで、順を追ってすべてのステップが詳しく解説されています。すべての手順を完了すると、ツールキットの実習ができるだけでなく、独自のニーズに合わせて拡張できるシステムを作成することができます。

医療記録の取り込み

ここ数年、Fast Healthcare Interoperability Resources(FHIR)標準が医療記録を保存、共有する将来の基盤として注目を浴びてきています。FHIR はデータを表す方法(JSON、XML、RDF)と、記録を共有するためのプロトコル(REST、HTML)の両方を定義します。

Google は最近、GCP で FHIR に準拠する形で Cloud Healthcare API を使用する方法について詳述したソリューション ドキュメントを公開しました。「Cloud Healthcare API を使用して FHIR 臨床データをクラウドにインポートする」では、Cloud Healthcare API の FHIR ストアの利点を説明しています。たとえば、ストアは他の GCP ベースのアプリ、BigQuery での分析、機械学習のためのソースとして使用できます。また、匿名データを必要とするアプリにデータを使用する場合に、API を使用してデータを匿名化することもできます。

さらに、データを GCP に読み込む(取り込む)方法を以下のシナリオに沿って説明しています。

  • ほぼリアルタイムの取り込み。一度に 1 つの記録を読み込みます。
  • 一括取り込み。取り込み対象の一連の記録を渡します。この取り込み対象は、個々の記録か一連の記録の単純なバッチになります。各記録をトランザクションで取り込み、関連記録のオールオアナッシングのインポートを行うことができます。
  • バッチ取り込み。インポート プロセスでは、用意した一連のファイルが Cloud Storage から読み取られます。

上記に加え、取り込み処理の自動化、Cloud Functions による記録の前処理や後処理、Cloud Pub/Sub によるサブスクリプション(モニタリング対象はバケットやその他のデータストアのイベント)の作成、Cloud Dataflow によるストリーミング データの操作などのオプションも詳しく説明されています。

このソリューションには、セキュリティと権限で注意を要する点が明確に記載されています。たとえば、Cloud Healthcare API がデータの作成と管理に使用する Cloud IAM 役割や、その役割に必要な権限について解説しています。

医療データの匿名化

医療情報は患者ケアの目的にのみ利用されるわけではありません。たとえば、医療専門家が患者の診断に役立てる医用画像は研究者にとってもデータとして価値があります。ただし、プライバシーの問題上、患者情報が見える方法で研究の共有や公開を行うべきでないことは明らかです。そのため、個人を特定できる情報(PII)と保護対象保険情報(PHI)は、公開する前にデータから削除する必要があります。

GCP では、Cloud Healthcare API を使用することで、この処理(匿名化)を実施できます。次の画像は匿名化後の X 線写真を示しています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/x-ray_de-identification.max-1600x1600.max-1300x1300.png

匿名化処理を説明したソリューションを 2 つご紹介します。「Cloud Healthcare API を使用した医用画像の匿名化」は、処理の仕組みの概要を説明したドキュメントで、画像の取り込みに利用できる GCP サービスや、画像の匿名化の前後に保存する方法などが記載されています。また、このソリューションでは、DICOM タグキーワードで匿名化対象のデータを指定する方法についても説明しています。

もう 1 つのソリューションは「Cloud Healthcare API を使用した医用画像の匿名化」で、独自の DICOM データセットを対象に Cloud Healthcare API でデータを匿名化する方法を示した段階的なチュートリアルです。このチュートリアルでは 2 つの使用例について説明しています。1 つは最小限のデータのみを画像に残す場合の例、もう 1 つはメタデータの削除や変更を行い、画像内のテキストを秘匿化する場合の例です。この匿名化処理では、医学的または科学的に関連する情報が保持されます。

このチュートリアルでは、API を呼び出して上記のタスクを実行する方法を示すだけでなく、適切な権限を設定して API がデータにアクセスできるようにする方法などが詳細に説明されています。

詳しくは、Google Cloud 医療ソリューションのページをご覧ください。

- by Mike Pope(GCP プラットフォーム全体のドキュメントのテクニカル エディター)

投稿先