Ensembles de données The Cancer Imaging Archive (TCIA)

The Cancer Imaging Archive (TCIA) héberge des collections d'images médicales supprimées, principalement au format DICOM. Les collections sont organisées en fonction de la maladie (comme le cancer du poumon), de la modalité de l'image (comme l'IRM ou le scanner) ou de la recherche.

L'API Cloud Healthcare fournit un accès à ces ensembles de données via Google Cloud (GCP), comme décrit dans la section Accès aux données Google Cloud.

Licence et attribution

Les ensembles de données d'accès public TCIA sont disponibles sous la licence Creative Commons Attribution 3.0 Unported. La plupart des collections sont "disponibles gratuitement pour consultation, téléchargement et utilisation à des fins commerciales, scientifiques et éducatives". Pour en savoir plus, consultez les Règles et restrictions relatives à l'utilisation des données TCIA.

Citations

Pour chaque collection que vous utilisez, citez à la fois le TCIA en général et les sources spécifiques de la collection.

Citation générale

Citez la publication TCIA générale suivante :

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Volume 26, Number 6, December, 2013, pp 1045-1057. (article)

Citations de collections

Chaque collection TCIA a des exigences de citation spécifiques. Il peut s'agir de citations de données, de citations de publication ou des deux. Certaines collections nécessitent également l'attribution de sources de données supplémentaires.

Pour en savoir plus, consultez la section Attribution TCIA. Vous pouvez également consulter les règles relatives à la citation et à l'utilisation des données sur chaque page de résumé de la collection sur le site TCIA.

Accès aux données Google Cloud

Vous pouvez obtenir les ensembles de données TCIA à partir de Cloud Storage, de BigQuery ou de l'API Cloud Healthcare.

Cloud Storage

Chaque ensemble de données TCIA est disponible dans un bucket Cloud Storage du projet Google Cloud nommé chc-tcia.

Accéder aux ensembles de données TCIA dans Cloud Storage

Les noms des ensembles d'ensembles de données sont au format suivant:

gs://gcs-public-data--healthcare-tcia-DATASET_ID

Pour trouver l'DATASET_ID, consultez la section Attribution TCIA. La dernière partie de l'URL de la page d'attribution (juste avant .html) correspond à l'ID de l'ensemble de données. Par exemple, la page des citations TCGA-BRCA contient l'URL suivante:

https://cloud.google.com/healthcare/docs/resources/public-datasets/tcia-attribution/tcga-brca.html

L'ID de l'ensemble de données est tcga-brca. Le bucket Cloud Storage correspondant est:

gs://gcs-public-data--healthcare-tcia-tcga-brca

Dans chaque bucket, les données sont organisées comme suit:

gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm

Chaque bucket Cloud Storage utilise le modèle "Paiements du demandeur" pour la facturation. Votre projet Google Cloud sera facturé pour les coûts associés à l'accès aux données TCIA. Pour en savoir plus, consultez la section Paiements du demandeur.

BigQuery

Chaque ensemble de données TCIA est disponible dans BigQuery dans le projet Google Cloud chc-tcia.

Accéder aux ensembles de données TCIA dans BigQuery

Pour en savoir plus sur l'accès aux données publiques dans BigQuery, consultez la page Ensembles de données publics BigQuery.

API Cloud Healthcare

Chaque ensemble de données TCIA est disponible dans l'API Cloud Healthcare du projet chc-tcia.

Pour demander l'accès aux ensembles de données TCIA, remplissez ce formulaire.

Accéder aux ensembles de données TCIA dans l'API Cloud Healthcare

Pour en savoir plus sur la structure des données, consultez les sections Présentation de DICOM et Utiliser la norme DICOMweb.

Lecteur de données

Vous pouvez également utiliser les visionneuses intégrées à l'API Cloud Healthcare:

eUnity: https://demo.eunity.app

IMS CloudVue: https://cloudvue.imstsvc.com