Conjuntos de dados do The Cancer Imaging Archive (TCIA)

O The Cancer Imaging Archive (TCIA) hospeda coleções de imagens médicas desidentificadas, principalmente no formato DICOM. As coleções são organizadas de acordo com a doença (como câncer de pulmões), a forma de imagem (como MRI ou TC) ou o foco da pesquisa.

A API Cloud Healthcare fornece acesso a esses conjuntos de dados por meio do Google Cloud (GCP), conforme descrito em Acesso a dados do Google Cloud.

Licença e atribuição

Os conjuntos de dados de acesso público TCIA estão disponíveis sob a Licença Creative Commons Atribuição 3.0. A maioria das coleções está "disponível gratuitamente para navegação, download e uso para fins comerciais, científicos e educacionais". Para detalhes, consulte as Políticas e restrições de uso de dados do TCIA.

Citações

Para cada coleção que você usa, cite o TCIA em geral e as fontes específicas da coleção.

Citação geral

Cite a seguinte publicação geral do TCIA:

Clark K, Vendt B, Smith K, Freymann J, Kirby J, Koppel P, Moore S, Phillips S, Maffitt D, Pringle M, Tarbox L, Prior F. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository, Journal of Digital Imaging, volume 26, número 6, dezembro de 2013, p. 1045-1057 (artigo).

Citação da coleção

Cada coleção do TCIA tem requisitos de citação específicos. Elas podem ser citações de dados, de publicação ou ambas. Algumas coleções também exigem atribuição para fontes de dados adicionais.

Os detalhes estão disponíveis na seção Atribuição de TCIA. Você também pode consultar a política de citação e uso de dados em cada página de resumo de coleta no site do TCIA.

Como acessar os conjuntos de dados TCIA

É possível receber os conjuntos de dados TCIA do Cloud Storage, do BigQuery ou usando a API Cloud Healthcare.

Cloud Storage

Cada conjunto de dados TCIA está disponível em um bucket do Cloud Storage dentro do projeto do Google Cloud chamado chc-tcia.

Acessar os conjuntos de dados TCIA no Cloud Storage

Os nomes dos intervalos do conjunto de dados estão no seguinte formato:

gs://gcs-public-data--healthcare-tcia-DATASET_ID

Para encontrar o DATASET_ID, consulte a seção Atribuição de TCIA. A última parte do URL da página de atribuição (imediatamente anterior a .html) corresponde ao código do conjunto de dados. Por exemplo, a página de citações TCGA-BRCA tem o seguinte URL:

https://cloud.google.com/healthcare-api/docs/resources/public-datasets/tcia-attribution/tcga-brca.html

O código do conjunto de dados é tcga-brca. O bucket correspondente do Cloud Storage é:

gs://gcs-public-data--healthcare-tcia-tcga-brca

Dentro de cada bucket, os dados são organizados da seguinte maneira:

gs://gcs-public-data--healthcare-DATASET/dicom/STUDY_UID/SERIES_UID/INSTANCE_UID.dcm

Cada bucket do Cloud Storage usa o modelo "Pagamentos do solicitante" para faturamento. Seu projeto do Google Cloud será cobrado pelas cobranças associadas ao acesso aos dados do TCIA. Para mais informações, consulte Pagamentos do solicitante.

BigQuery

Cada conjunto de dados TCIA está disponível no BigQuery no projeto chc-tcia do Google Cloud.

Acessar os conjuntos de dados TCIA no BigQuery

Para informações sobre como acessar dados públicos no BigQuery, consulte Conjuntos de dados públicos do BigQuery.

API Cloud Healthcare

Cada conjunto de dados TCIA está disponível na API Cloud Healthcare no projeto chc-tcia.

Para solicitar acesso aos conjuntos de dados TCIA, preencha este formulário.

Acessar os conjuntos de dados TCIA na API Cloud Healthcare

Para informações sobre a estrutura dos dados, consulte a visão geral do DICOM e Como usar o padrão DICOMweb.

Visualizadores de dados externos

Também é possível usar os visualizadores integrados à API Cloud Healthcare:

eUnity: https://demo.eunity.app

IMS CloudVue: https://cloudvue.imostsvc.com