Dati The Cancer Genome Atlas

Il programma Cancer Genome Atlas (TCGA) è stato uno sforzo completo e coordinato per accelerare la comprensione della base molecolare del cancro attraverso l'applicazione di tecnologie di analisi del genoma, inclusa la sequenziamento del genoma su larga scala. I dati generati dal programma hanno molecolato oltre 20.000 tumori primari e hanno abbinato campioni normali che coprono 33 diversi tipi di cancro.

L'Institute for Systems Biology Cancer Gateway nel cloud (ISB-CGC) fornisce l'accesso ai dati e ai metadati TCGA nelle tabelle BigQuery per facilitare l'accesso e l'analisi. Queste tabelle consolidano le informazioni sparse su decine di migliaia di dati XML e tabular ad accesso aperto in un formato interrogabile per tipo di dati (ad esempio, clinico, biospecie, espressione genica e mutazione) per facilitare l'accesso e l'analisi.

Analogamente, ISB-CGC ha creato tabelle BigQuery per altri programmi oncologici; consulta la documentazione relativa ai programmi ISB-CGC.

ISB-CGC fornisce inoltre esempi di blocco note sia in R che in Python che vanno dalla creazione e dall'analisi di query semplici a complesse utilizzando le tabelle BigQuery ISB-CGC:

Accesso a set di dati

Cartelle Cloud Storage

L'ISB-CGC archivia i percorsi di spazio di archiviazione sul cloud verso i dati TCGA ospitati dal Genomic Data Commons del National Cancer Institute nel set di dati BigQuery isb-cgc-bq.GDC_case_file_metadata. Per informazioni su come accedere a queste posizioni dei file, consulta la documentazione di ISB-CGC TCGA.

Set di dati BigQuery

Puoi accedere ai seguenti set di dati TCGA in BigQuery per l'esplorazione dei dati e l'esecuzione di query:

Per esplorare altri set di dati relativi al cancro ISB-CGC, utilizza lo strumento di ricerca BigQuery IIS-CGC. Puoi trovare questi dati nel progetto isb-cgc-bq in Google BigQuery. Per ulteriori informazioni sull'ISB-CGC e sui relativi dati, consulta la documentazione di ISB-CGC.

Informazioni sui dati

Utilizzo: questo set di dati è disponibile pubblicamente per qualsiasi utilizzo ai sensi dei termini forniti dall'origine del set di dati (https://cancergenome.nih.gov/) e viene fornito "così com'è" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso del set di dati.