Il programma Cancer Genome Atlas (TCGA) è stato un impegno completo e coordinato per accelerare la comprensione delle basi molecolari del cancro tramite l'applicazione di tecnologie di analisi del genoma, inclusa la sequenziazione del genoma su larga scala. Dati generati dal programma in modo molecolare ha caratterizzato oltre 20.000 tumori primari e campioni normali abbinati in 33 diversi tipi di cancro.
In Institute for Systems Biology Cancer Gateway nel Cloud (ISB-CGC) fornisce accesso ai dati TCGA e metadati in tabelle BigQuery per facilitare l'accesso e l'analisi. Queste tabelle raggruppano le informazioni sparse su decine di migliaia di dati TCGA XML e tabulari di accesso aperto in un formato interrogabile in base al tipo di dati (ad esempio clinici, biospecimen, espressione genica e mutazione) per facilitare l'accesso e l'analisi.
Analogamente, ISB-CGC ha creato tabelle BigQuery per altri programmi per il cancro. consulta la documentazione dei programmi ISB-CGC.
ISB-CGC fornisce anche esempi di notebook in R e Python che vanno dalla creazione di query semplici a quelle complesse e all'analisi utilizzando le tabelle BigQuery di ISB-CGC:
Accesso a set di dati
Cartelle Cloud Storage
ISB-CGC archivia i percorsi di spazio di archiviazione sul cloud per i dati TCGA ospitati da il National Cancer Institute Genomic Data Commons in il set di dati BigQuery isb-cgc-bq.GDC_case_file_metadata. Consulta la documentazione TCGA ISB-CGC per scoprire come accedere a queste posizioni dei file.
Set di dati di BigQuery
Puoi accedere ai seguenti set di dati TCGA in BigQuery per dell'esplorazione e delle query:
Per esplorare altri set di dati sul cancro di ISB-CGC, utilizza lo strumento di ricerca BigQuery di ISB-CGC. Puoi trovare questi dati nel progetto isb-cgc-bq in Google BigQuery. Per ulteriori informazioni su ISB-CGC e sui relativi dati, vedi Documentazione di ISB-CGC.
Informazioni sui dati
Utilizzo: questo set di dati è disponibile pubblicamente per chiunque lo utilizzi ai sensi dei termini forniti dall'origine del set di dati (https://cancergenome.nih.gov/) ed è fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso del set di dati.