Set di dati TCIA (Cancer Imaging Archive)

Il Cancer Imaging Archive (TCIA) ospita raccolte di immagini mediche non identificate, principalmente in formato DICOM. Le collezioni sono organizzate in base alla malattia (come il cancro ai polmoni), alla modalità dell'immagine (come MRI o TAC) o alla ricerca.

L'API Cloud Healthcare fornisce l'accesso a questi set di dati tramite Google Cloud (GCP), come descritto in Accesso ai dati di Google Cloud.

Licenza e attribuzione

I set di dati di accesso pubblico TCIA sono disponibili in base alla licenza Creative Commons Attribution 3.0 Unported. La maggior parte delle raccolte sono "disponibili gratuitamente per sfogliarle, scaricarle e utilizzarle a scopi commerciali, scientifici e didattici." Per i dettagli, consulta le Norme e limitazioni sull'utilizzo dei dati di TCIA.

Citazioni

Per ogni collezione che utilizzi, cita il TCIA in generale e le fonti specifiche della raccolta.

Citazione generale

Cita la seguente pubblicazione generale sulla Tcia:

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Keeping and Operating a Public Information Repository, Journal of Digital Imaging, Volume 26, Number 6, dicembre 2013, pp 1045-1057. (Articolo)

Citazioni di raccolte

Ogni raccolta Tcia ha requisiti di citazione specifici. ad esempio citazioni di dati, citazioni o pubblicazioni. Alcune raccolte richiedono anche l'attribuzione per origini dati aggiuntive.

I dettagli sono disponibili nella sezione Attribuzione TCIA. Puoi anche fare riferimento alle norme relative alle citazioni e all'utilizzo dei dati in ogni pagina di riepilogo della raccolta sul sito di TCIA.

Accesso ai set di dati TCIA

Puoi ottenere i set di dati TCIA da Cloud Storage, BigQuery o utilizzando l'API Cloud Healthcare.

Cloud Storage

Ogni set di dati TCIA è disponibile in un bucket Cloud Storage all'interno del progetto Google Cloud denominato chc-tcia.

Vai ai set di dati TCIA in Cloud Storage

I nomi dei bucket di set di dati hanno il seguente formato:

gs://gcs-public-data--healthcare-tcia-DATASET_ID

Per trovare l'DATASET_ID, consulta la sezione Attribuzione di TCIA. L'ultima parte dell'URL della pagina di attribuzione (immediatamente precedente .html) corrisponde all'ID del set di dati. Ad esempio, la pagina delle citazioni di TCGA-BRCA contiene il seguente URL:

https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html

L'ID del set di dati è tcga-brca. Il corrispondente bucket Cloud Storage è:

gs://gcs-public-data--healthcare-tcia-tcga-brca

All'interno di ogni bucket, i dati sono organizzati nel seguente modo:

gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm

Ogni bucket Cloud Storage utilizza il modello "Pagamenti a carico del richiedente" per la fatturazione. Al tuo progetto Google Cloud verranno addebitati i costi associati all'accesso ai dati TCIA. Per ulteriori informazioni, consulta la sezione Pagamenti a carico del richiedente.

BigQuery

Ogni set di dati TCIA è disponibile in BigQuery nel progetto Google Cloud chc-tcia.

Vai ai set di dati TCIA in BigQuery

Per informazioni sull'accesso ai dati pubblici in BigQuery, consulta la pagina sui set di dati pubblici BigQuery.

API Cloud Healthcare

Ogni set di dati TCIA è disponibile nell'API Cloud Healthcare nel progetto chc-tcia.

Per richiedere l'accesso ai set di dati TCIA, compila questo modulo.

Vai ai set di dati TCIA nell'API Cloud Healthcare

Per informazioni sulla struttura dei dati, consulta le sezioni Panoramica di DICOM e Utilizzo dello standard DICOMweb.

Utenti che hanno visualizzato dati esterni

Puoi anche utilizzare i visualizzatori integrati con l'API Cloud Healthcare:

eUnity: https://demo.eunity.app

IMS CloudVue: https://cloudvue.imstsvc.com