Datasets von Cancer Imaging Archive (TCIA)

Das Cancer Imaging Archive (TCIA) enthält Sammlungen von de-identifizierten medizinischen Bildern, hauptsächlich im DICOM-Format. Sammlungen sind nach Krankheiten (z. B. Lungenkrebs), Bildmodalitäten (z. B. MRT oder Computertomografie) oder Forschungsschwerpunkten organisiert.

Die Cloud Healthcare API bietet Zugriff auf diese Datasets über Google Cloud (GCP), wie unter Google Cloud-Datenzugriff beschrieben.

Lizenz und Namensnennung

Die TCIA-Datasets mit öffentlichem Zugriff sind unter der Creative Commons Attribution 3.0 Unported License verfügbar. Die meisten Sammlungen "können kostenlos durchsucht, heruntergeladen und für kommerzielle, wissenschaftliche und pädagogische Zwecke verwendet werden." Weitere Informationen finden Sie in den Richtlinien und Einschränkungen der TCIA-Datennutzung.

Zitate

Geben Sie für jede verwendete Sammlung sowohl den TCIA im Allgemeinen als auch die spezifischen Quellen für die Sammlung an.

Allgemeines Zitat

Zitieren Sie die folgende allgemeine TCIA-Publikation:

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Ausgabe 26, Nummer 6, Dezember, 2013, Seiten 1045–1057. (Artikel)

Sammlung von Zitaten

Für jede TCIA-Sammlung gelten bestimmte Zitatanforderungen. Dabei kann es sich um Daten- oder Veröffentlichungszitate oder beides handeln. Einige Sammlungen erfordern auch die Zuordnung für zusätzliche Datenquellen.

Weitere Informationen finden Sie im Abschnitt TCIA Attribution. Sie können auch die Zitat- und Datennutzungsrichtlinien auf jeder Seite der Sammlungszusammenfassung auf der TCIA-Website lesen.

Auf TCIA-Datasets zugreifen

Sie können die TCIA-Datasets aus Cloud Storage, BigQuery oder der Cloud Healthcare API abrufen.

Cloud Storage

Jedes TCIA-Dataset ist in einem Cloud Storage-Bucket im Google Cloud-Projekt mit dem Namen chc-tcia verfügbar.

TCIA-Datasets in Cloud Storage aufrufen

Dataset-Bucket-Namen haben das folgende Format:

gs://gcs-public-data--healthcare-tcia-DATASET_ID

Die DATASET_ID finden Sie im Abschnitt TCIA Attribution. Der letzte Teil der URL der Attributionsseite (unmittelbar vor .html) entspricht der Dataset-ID. Die Seite TCGA-BRCA-Zitate hat beispielsweise die folgende URL:

https://cloud.google.com/healthcare/docs/resources/public-datasets/tcia-attribution/tcga-brca.html

Die Dataset-ID lautet tcga-brca. Der entsprechende Cloud Storage-Bucket lautet:

gs://gcs-public-data--healthcare-tcia-tcga-brca

Die Daten sind in jedem Bucket wie folgt organisiert:

gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm

Jeder Cloud Storage-Bucket verwendet für die Abrechnung das Modell "Sender bezahlt". Ihrem Google Cloud-Projekt werden die Kosten für den Zugriff auf die TCIA-Daten in Rechnung gestellt. Weitere Informationen finden Sie unter Sender bezahlt.

BigQuery

Jedes TCIA-Dataset ist in BigQuery im Google Cloud-Projekt chc-tcia verfügbar.

TCIA-Datasets in BigQuery aufrufen

Informationen zum Zugriff auf öffentliche Daten in BigQuery finden Sie unter Öffentliche BigQuery-Datasets.

Cloud Healthcare API

Jedes TCIA-Dataset ist in der Cloud Healthcare API im Projekt chc-tcia verfügbar.

Füllen Sie dieses Formular aus, um Zugriff auf die TCIA-Datasets anzufordern.

TCIA-Datasets in der Cloud Healthcare API aufrufen

Informationen zur Struktur der Daten finden Sie in der DICOM-Übersicht und unter DICOMweb-Standard verwenden.

Externe Datenbetrachter

Sie können auch die in die Cloud Healthcare API integrierten Viewer verwenden:

eUnity: https://demo.eunity.app

IMS CloudVue: https://cloudvue.imstsvc.com