癌症影像档案 (TCIA) 收集了去标识化的医疗图片,主要采用 DICOM 格式。集合按疾病(如肺癌)、图片模式(如 MRI 或 CT)或研究重点进行组织。
如 Google Cloud 数据访问中所述,Cloud Healthcare API 通过 Google Cloud (GCP) 提供对这些数据集的访问权限。
许可和署名
TCI 公共访问数据集根据知识共享署名 3.0 未移植许可证提供。大多数集合“可供免费浏览、下载和用于商业、科学和教育目的”。如需了解详情,请参阅 TCIA 数据使用政策和限制。
引用
对于您使用的每个集合,请引用一般 TCIA 和集合的特定来源。
一般引用
引用以下 TCIA 一般出版物:
Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F.癌症影像档案 (TCIA):维护和运营公共信息存储库《数字影像杂志》第 26 卷,第 6 期,2013 年 12 月,第 1045-1057 页。(论文)
集合引用
每个 TCIA 集合都有特定的引用要求。这些可能是数据引用、出版物引用或两者都引用。某些集合还要求提供其他数据源的出处。
如需了解详情,请参阅 TCIA 署名部分。您还可以参阅 TCIA 网站上每个集合摘要页面上的引用和数据使用政策。
访问 TCIA 数据集
您可以从 Cloud Storage、BigQuery 或使用 Cloud Healthcare API 获取 TCIA 数据集。
Cloud Storage
每个 TCIA 数据集都可在名为 chc-tcia
的 Google Cloud 项目的 Cloud Storage 存储桶中使用。
数据集存储桶名称采用以下格式:
gs://gcs-public-data--healthcare-tcia-DATASET_ID
要查找 DATASET_ID,请参阅 TCIA 署名部分。归因页面网址的最后一部分(就在 .html
前面)对应于数据集 ID。例如,TCGA-BRCA 引用页面包含以下网址:
https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html
数据集 ID 为 tcga-brca
。相应的 Cloud Storage 存储桶为:
gs://gcs-public-data--healthcare-tcia-tcga-brca
在每个存储桶中,数据的组织方式如下:
gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm
每个 Cloud Storage 存储桶都使用“请求者付款”模式进行结算。您的 Google Cloud 项目将被收取与访问 TCIA 数据相关的费用。如需了解详情,请参阅请求者付款。
BigQuery
每个 TCIA 数据集都可在 chc-tcia
Google Cloud 项目的 BigQuery 中使用。
如需了解如何访问 BigQuery 中的公共数据,请参阅 BigQuery 公共数据集。
Cloud Healthcare API
每个 TCIA 数据集都可以在 chc-tcia
项目的 Cloud Healthcare API 中使用。
要请求访问 TCIA 数据集,请填写此表单。
转到 Cloud Healthcare API 中的 TCI 数据集
如需了解数据的结构,请参阅 DICOM 概览和使用 DICOMweb 标准。
外部数据查看器
您还可以使用与 Cloud Healthcare API 集成的查看器:
eUnity:https://demo.eunity.app
IMS CloudVue:https://cloudvue.imstsvc.com