I dati dell'Atlante del genoma del cancro

Atlante del genoma del cancro (TCGA) era un programma completo e coordinato per accelerare la comprensione della base molecolare del cancro attraverso l'applicazione di tecnologie di analisi del genoma, tra cui il sequenziamento del genoma su larga scala. Dati generati dal programma in modo molecolare ha caratterizzato oltre 20.000 tumori primari e campioni normali abbinati in 33 diversi tipi di cancro.

In Institute for Systems Biology Cancer Gateway nel Cloud (ISB-CGC) fornisce accesso ai dati TCGA e metadati in tabelle BigQuery per facilitare l'accesso e l'analisi. Queste tabelle consolidano informazioni sparse in decine di migliaia di XML e tabulari ad accesso libero i dati TCGA in un formato interrogabile per tipo di dati (ad esempio, clinico, biospecimen, espressione genica e mutazione) per facilitare l'accesso e l'analisi.

Allo stesso modo, ISB-CGC ha creato tabelle BigQuery per altri programmi per il cancro; vedi il Documentazione dei programmi IB-CGC.

ISB-CGC fornisce anche esempi di blocchi note in R e Python che vanno da creazione e analisi di query da semplici a complesse utilizzando le tabelle BigQuery ISB-CGC:

Accesso a set di dati

Cartelle di Cloud Storage

ISB-CGC archivia i percorsi di spazio di archiviazione sul cloud per i dati TCGA ospitati da il National Cancer Institute Genomic Data Commons in il set di dati BigQuery isb-cgc-bq.GDC_case_file_metadata. Consulta le Documentazione del TCGA di IB-CGC per scoprire come accedere alle posizioni dei file.

Set di dati di BigQuery

Puoi accedere ai seguenti set di dati TCGA in BigQuery per dell'esplorazione e delle query:

Per esplorare altri set di dati sul cancro ISB-CGC, utilizza Strumento di ricerca BigQuery IB-CGC. Puoi trovare questi dati nella Progetto isb-cgc-bq in Google BigQuery. Per ulteriori informazioni su ISB-CGC e sui relativi dati, vedi Documentazione di ISB-CGC.

Informazioni sui dati

Utilizzo: questo set di dati è disponibile pubblicamente e può essere utilizzato da chiunque ai sensi del Termini forniti dall'origine del set di dati (https://cancergenome.nih.gov/) ed è fornito "così com'è" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso del set di dati.