Das Cancer Imaging Archive (TCIA) enthält Sammlungen von de-identifizierten medizinischen Bildern, hauptsächlich im DICOM-Format. Sammlungen sind nach Krankheiten (z. B. Lungenkrebs), Bildmodalitäten (z. B. MRT oder Computertomografie) oder Forschungsschwerpunkten organisiert.
Die Cloud Healthcare API bietet Zugriff auf diese Datasets über Google Cloud (GCP), wie unter Google Cloud-Datenzugriff beschrieben.
Lizenz und Quellenangabe
Die TCIA-Datasets mit öffentlichem Zugriff sind unter der Creative Commons Attribution 3.0 Unported License verfügbar. Die meisten Sammlungen "können kostenlos durchsucht, heruntergeladen und für kommerzielle, wissenschaftliche und pädagogische Zwecke verwendet werden." Weitere Informationen finden Sie in den Richtlinien und Einschränkungen der TCIA-Datennutzung.
Zitate
Geben Sie für jede verwendete Sammlung sowohl den TCIA im Allgemeinen als auch die spezifischen Quellen für die Sammlung an.
Allgemeines Zitat
Zitieren Sie die folgende allgemeine TCIA-Publikation:
Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, Ausgabe 26, Nummer 6, Dezember, 2013, Seiten 1045–1057. (Artikel)
Sammlung von Zitaten
Für jede TCIA-Sammlung gelten bestimmte Zitatanforderungen. Dabei kann es sich um Daten- oder Veröffentlichungszitate oder beides handeln. Einige Sammlungen erfordern auch die Zuordnung für zusätzliche Datenquellen.
Weitere Informationen finden Sie im Abschnitt TCIA Attribution. Sie können auch die Zitat- und Datennutzungsrichtlinien auf jeder Seite der Sammlungszusammenfassung auf der TCIA-Website lesen.
Auf TCIA-Datasets zugreifen
Sie können die TCIA-Datasets aus Cloud Storage, BigQuery oder der Cloud Healthcare API abrufen.
Cloud Storage
Jedes TCIA-Dataset ist in einem Cloud Storage-Bucket im Google Cloud-Projekt mit dem Namen chc-tcia
verfügbar.
TCIA-Datasets in Cloud Storage aufrufen
Dataset-Bucket-Namen haben das folgende Format:
gs://gcs-public-data--healthcare-tcia-DATASET_ID
Die DATASET_ID finden Sie im Abschnitt TCIA Attribution. Der letzte Teil der URL der Attributionsseite (unmittelbar vor .html
) entspricht der Dataset-ID. Die Seite TCGA-BRCA-Zitate hat beispielsweise die folgende URL:
https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html
Die Dataset-ID lautet tcga-brca
. Der entsprechende Cloud Storage-Bucket lautet:
gs://gcs-public-data--healthcare-tcia-tcga-brca
Die Daten sind in jedem Bucket wie folgt organisiert:
gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm
Jeder Cloud Storage-Bucket verwendet für die Abrechnung das Modell "Sender bezahlt". Ihrem Google Cloud-Projekt werden die Kosten für den Zugriff auf die TCIA-Daten in Rechnung gestellt. Weitere Informationen finden Sie unter Anforderer bezahlt.
BigQuery
Jedes TCIA-Dataset ist in BigQuery im Google Cloud-Projekt chc-tcia
verfügbar.
TCIA-Datasets in BigQuery aufrufen
Informationen zum Zugriff auf öffentliche Daten in BigQuery finden Sie unter Öffentliche BigQuery-Datasets.
Cloud Healthcare API
Jedes TCIA-Dataset ist in der Cloud Healthcare API im Projekt chc-tcia
verfügbar.
Füllen Sie dieses Formular aus, um Zugriff auf die TCIA-Datasets anzufordern.
TCIA-Datasets in der Cloud Healthcare API aufrufen
Informationen zur Struktur der Daten finden Sie in der DICOM-Übersicht und unter DICOMweb-Standard verwenden.
Externe Datenbetrachter
Sie können auch die in die Cloud Healthcare API integrierten Viewer verwenden:
eUnity: https://demo.eunity.app
IMS CloudVue: https://cloudvue.imstsvc.com