El archivo de imágenes de cáncer (TCIA) aloja colecciones de imágenes médica desidentificadas, principalmente en el formato de DICOM. Las colecciones están organizadas según la enfermedad (como el cáncer de pulmón), la modalidad de imagen (como MRI o CT) o el enfoque de la investigación.
La API de Cloud Healthcare proporciona acceso a estos conjuntos de datos a través de Google Cloud (GCP), como se describe en Acceso a los datos de Google Cloud.
Licencia y atribución
Los conjuntos de datos de acceso público de TCIA están disponibles en la licencia sin portar de atribución de bienes comunes 3.0. La mayoría de las colecciones están "disponibles de forma gratuita para navegar, descargar y usar con fines comerciales, científicos y educativos". Para obtener más información, consulta las políticas y las restricciones de uso de datos de TCIA.
Citas
En cada colección que uses, cita TCIA en general y las fuentes específicas de la colección.
Citas generales
Cita la siguiente publicación general de TCIA:
Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. El archivo de imágenes de cáncer (TCIA): realiza el mantenimiento y opera un repositorio de información pública, Journal of Digital Imaging, volumen 26, número 6, diciembre de 2013, páginas 1045-1057. (Papel)
Citas de recolección
Cada colección de TCIA tiene requisitos específicos para las citas. Pueden ser citas de datos, de publicaciones o ambas. Algunas colecciones también requieren la atribución para las fuentes de datos adicionales.
Los detalles están disponibles en la sección Atribución de TCIA. También puedes consultar la política de citas y de uso de datos en la página de resumen de cada colección del sitio de TCIA.
Accede a los conjuntos de datos de TCIA
Puedes obtener los conjuntos de datos de TCIA desde Cloud Storage, desde BigQuery o mediante la API de Cloud Healthcare.
Cloud Storage
Cada conjunto de datos de TCIA está disponible en un depósito de Cloud Storage dentro del proyecto de Google Cloud llamado chc-tcia
.
Ir a los conjuntos de datos de TCIA en Cloud Storage
Los nombres de los depósitos de los conjuntos de datos tienen el siguiente formato:
gs://gcs-public-data--healthcare-tcia-DATASET_ID
Para encontrar el DATASET_ID, consulta la sección Atribución de TCIA. La última parte de la URL de la página de atribución (que está inmediatamente antes de .html
) corresponde al ID del conjunto de datos. Por ejemplo, la página de citas de TCGA-BRCA tiene la siguiente URL:
https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html
El ID del conjunto de datos es tcga-brca
. El bucket de Cloud Storage correspondiente es:
gs://gcs-public-data--healthcare-tcia-tcga-brca
Dentro de cada bucket, los datos están organizados de la siguiente manera:
gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm
Cada bucket de Cloud Storage usa el modelo de "Pagos del solicitante" para la facturación. Los cargos asociados con el acceso a los datos de TCIA se facturarán a tu proyecto de Google Cloud. Para obtener más información, consulta Pagos del solicitante.
BigQuery
Cada conjunto de datos TCIA está disponible en BigQuery en el proyecto de Google Cloud chc-tcia
.
Ir a los conjuntos de datos de TCIA en BigQuery
Para obtener información sobre cómo acceder a los datos públicos en BigQuery, consulta Conjuntos de datos públicos de BigQuery.
API de Cloud Healthcare
Cada conjunto de datos de TCIA está disponible en la API de Cloud Healthcare en el proyecto chc-tcia
.
Para solicitar acceso a los conjuntos de datos de TCIA, completa este formulario.
Ir a los conjuntos de datos de TCIA en la API de Cloud Healthcare
Para obtener información sobre la estructura de los datos, consulta la descripción general de DICOM y el uso del estándar DICOMweb.
Lectores de datos externos
También puedes usar los visores integrados con la API de Cloud Healthcare:
eUnity: https://demo.eunity.app
IMS CloudVue: https://cloudvue.imstsvc.com