癌症影像档案 (TCIA) 数据集

癌症影像档案 (TCIA) 收集了去标识化的医疗图片,主要采用 DICOM 格式。集合按疾病(如肺癌)、图片模式(如 MRI 或 CT)或研究重点进行组织。

Google Cloud 数据访问中所述,Cloud Healthcare API 通过 Google Cloud (GCP) 提供对这些数据集的访问权限。

许可和署名

TCI 公共访问数据集根据知识共享署名 3.0 未移植许可证提供。大多数集合“可供免费浏览、下载和用于商业、科学和教育目的”。如需了解详情,请参阅 TCIA 数据使用政策和限制

引用

对于您使用的每个集合,请引用一般 TCIA 和集合的特定来源。

一般引用

引用以下 TCIA 一般出版物:

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F.癌症影像档案 (TCIA):维护和运营公共信息存储库《数字影像杂志》第 26 卷,第 6 期,2013 年 12 月,第 1045-1057 页。(论文

集合引用

每个 TCIA 集合都有特定的引用要求。这些可能是数据引用、出版物引用或两者都引用。某些集合还要求提供其他数据源的出处。

如需了解详情,请参阅 TCIA 署名部分。您还可以参阅 TCIA 网站上每个集合摘要页面上的引用和数据使用政策。

访问 TCIA 数据集

您可以从 Cloud Storage、BigQuery 或使用 Cloud Healthcare API 获取 TCIA 数据集。

Cloud Storage

每个 TCIA 数据集都可在名为 chc-tcia 的 Google Cloud 项目的 Cloud Storage 存储分区中使用。

转到 Cloud Storage 中的 TCIA 数据集

数据集存储分区名称采用以下格式:

gs://gcs-public-data--healthcare-tcia-DATASET_ID

要查找 DATASET_ID,请参阅 TCIA 署名部分。归因页面网址的最后一部分(就在 .html 前面)对应于数据集 ID。例如,TCGA-BRCA 引用页面包含以下网址:

https://cloud.google.com/healthcare/docs/resources/public-datasets/tcia-attribution/tcga-brca.html

数据集 ID 为 tcga-brca。相应的 Cloud Storage 存储分区为:

gs://gcs-public-data--healthcare-tcia-tcga-brca

在每个存储分区中,数据的组织方式如下:

gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm

每个 Cloud Storage 存储分区都使用“请求者付款”模式进行结算。您的 Google Cloud 项目将被收取与访问 TCIA 数据相关的费用。如需了解详情,请参阅请求者付款

BigQuery

每个 TCIA 数据集都可在 chc-tcia Google Cloud 项目的 BigQuery 中使用。

转到 BigQuery 中的 TCIA 数据集

如需了解如何访问 BigQuery 中的公共数据,请参阅 BigQuery 公共数据集

Cloud Healthcare API

每个 TCIA 数据集都可以在 chc-tcia 项目的 Cloud Healthcare API 中使用。

要请求访问 TCIA 数据集,请填写此表单

转到 Cloud Healthcare API 中的 TCI 数据集

如需了解数据的结构,请参阅 DICOM 概览使用 DICOMweb 标准

外部数据查看器

您还可以使用与 Cloud Healthcare API 集成的查看器:

eUnity:https://demo.eunity.app

IMS CloudVue:https://cloudvue.imstsvc.com