TCIA héberge des collections d'images médicales anonymisées, principalement au format DICOM. Les collections sont organisées en fonction de la maladie (par exemple, le cancer du poumon), de la modalité d'image (par exemple, l'IRM ou le scanner) ou de l'axe de recherche.
L'API Cloud Healthcare permet d'accéder à ces ensembles de données via Google Cloud (GCP), comme décrit dans la section Accès aux données Google Cloud.
Licence et attribution
Les ensembles de données d'accès public TCIA sont disponibles sous la licence Creative Commons Attribution 3.0 Unported. La plupart des collections sont "disponibles gratuitement pour consultation, téléchargement et utilisation à des fins commerciales, scientifiques et éducatives". Pour en savoir plus, consultez les règles et restrictions applicables à l'utilisation des données TCIA.
Citations
Pour chaque collection que vous utilisez, citez à la fois le service TCIA en général et les sources spécifiques de la collection.
Citation générale
Citez la publication TCIA générale suivante :
Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Volume 26, Number 6, December, 2013, pp 1045-1057. (article)
Citations de collections
Chaque collection TCIA est soumise à des exigences de citation spécifiques. Il peut s'agir de citations de données, de citations de publication ou des deux. Certaines collections nécessitent également l'attribution de sources de données supplémentaires.
Pour en savoir plus, consultez la section Attribution TCIA. Vous pouvez également consulter les règles de citation et d'utilisation des données sur la page de résumé de chaque collection sur le site TCIA.
Accéder aux ensembles de données TCIA
Vous pouvez obtenir les ensembles de données TCIA à partir de Cloud Storage, de BigQuery ou de l'API Cloud Healthcare.
Cloud Storage
Chaque ensemble de données TCIA est disponible dans un bucket Cloud Storage du projet Google Cloud nommé chc-tcia
.
Accéder aux ensembles de données TCIA dans Cloud Storage
Les noms de buckets de données sont au format suivant :
gs://gcs-public-data--healthcare-tcia-DATASET_ID
Pour trouver l'identifiant DATASET_ID, consultez la section Attribution TCIA. La dernière partie de l'URL de la page d'attribution (immédiatement avant .html
) correspond à l'ID de l'ensemble de données. Par exemple, la page des citations TCGA-BRAA contient l'URL suivante :
https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html
L'ID de l'ensemble de données est tcga-brca
. Le bucket Cloud Storage correspondant est :
gs://gcs-public-data--healthcare-tcia-tcga-brca
Dans chaque bucket, les données sont organisées comme suit :
gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm
Chaque bucket Cloud Storage utilise le modèle "Paiements du demandeur" pour la facturation. Les frais associés à l'accès aux données TCIA seront facturés sur votre projet Google Cloud. Pour en savoir plus, consultez la section Paiements du demandeur.
BigQuery
Chaque ensemble de données TCIA est disponible dans BigQuery dans le projet Google Cloud chc-tcia
.
Accéder aux ensembles de données TCIA dans BigQuery
Pour en savoir plus sur l'accès aux données publiques dans BigQuery, consultez la page Ensembles de données publics BigQuery.
API Cloud Healthcare
Chaque ensemble de données TCIA est disponible dans l'API Cloud Healthcare du projet chc-tcia
.
Pour demander l'accès aux ensembles de données TCIA, remplissez ce formulaire.
Accéder aux ensembles de données TCIA dans l'API Cloud Healthcare
Pour en savoir plus sur la structure des données, consultez les pages Présentation de DICOM et Utiliser la norme DICOMweb.
Lecteurs de données externes
Vous pouvez également utiliser les lecteurs intégrés à l'API Cloud Healthcare :
eUnity: https://demo.eunity.app
IMS CloudVue: https://cloudvue.imstsvc.com