Datos de The Cancer Genome Atlas

El programa Cancer Genome Atlas (TCGA) fue un esfuerzo conjunto y coordinado para acelerar la comprensión de la base molecular del cáncer mediante la aplicación de tecnologías de análisis de genomas, incluidas las secuencias de genomas a gran escala. Los datos generados a partir del programa caracterizó molecularmente más de 20,000 cánceres primarios e identificó muestras normales que abarcan 33 tipos de cáncer diferentes.

El Institute for Systems Biology Cancer Gateway in the Cloud (ISB-CGC) proporciona acceso a datos y metadatos de TCGA en tablas de BigQuery para facilitar el acceso y el análisis. Estas tablas consolidan la información dispersa en miles de datos XML y tabulares de acceso abierto de TCGA en un formato que se puede consultar por tipo de datos (por ejemplo, clínico, biospecífico, expresión genética y mutación) para facilitar el acceso y análisis.

De manera similar, el ISB-CGC creó tablas de BigQuery para otros programas contra el cáncer; consulta la documentación sobre los programas del ISB-CGC.

ISB-CGC también proporciona ejemplos de notebooks en R y Python que varían desde una compilación de consultas simple a compleja mediante el análisis y la compilación de consultas de ISB-CGC en BigQuery:

Acceso al conjunto de datos

Carpetas de Cloud Storage

ISB-CGC almacena rutas de almacenamiento en la nube para datos de TCGA alojados por el Instituto Nacional del CáncerGenomic Data Commons en el conjunto de datos de BigQueryisb-cgc-bq.GDC_case_file_metadata , Consulta la documentación de TCGA de ISB-CGC para saber cómo acceder a estas ubicaciones de archivos.

Conjuntos de datos de BigQuery

Puedes acceder a los siguientes conjuntos de datos de TCGA en BigQuery para explorar y consultar los datos:

Para explorar otros conjuntos de datos sobre el cáncer ISB-CGC, usa la Herramienta de búsqueda de BigQuery ISB-CGC. Puedes encontrar estos datos en el proyecto isb-cgc-bq en Google BigQuery. Para obtener más información sobre ISB-CGC y sus datos, consulta la documentación de ISB-CGC.

Acerca de los datos

Uso: Este conjunto de datos está disponible públicamente para que lo use cualquier persona de conformidad con las condiciones que provee la fuente del conjunto de datos (https://cancergenome.nih.gov/) y se proporciona "COMO ESTÁ", sin ninguna garantía por parte de Google, ni explícita ni implícita. Google rehúsa toda responsabilidad por cualquier daño, directo o indirecto, que resulte del uso del conjunto de datos.