Daten aus dem Cancer Genome Atlas

Das Programm The Cancer Genome Atlas (TCGA) war eine umfassende und koordinierte Anstrengung, um das Verständnis der molekularen Grundlagen von Krebs durch die Anwendung von Genomanalyse-Technologien, einschließlich der Sequenzierung von Genomen in großem Maßstab, zu beschleunigen. Die mit dem Programm generierten Daten charakterisierten über 20.000 primäre Krebs- und dazu passende normale Proben aus 33 verschiedenen Krebsarten auf molekularer Ebene.

Das Institute for Systems Biology Cancer Gateway in the Cloud (ISB-CGC) bietet Zugriff auf TCGA-Daten und -Metadaten in BigQuery-Tabellen für einen einfachen Zugriff und eine Analyse. Diese Tabellen fassen die über Zehntausende von XML- und tabellarischen, frei zugänglichen TCGA-Daten verstreuten Informationen in einem abfragbaren Format nach Datentyp (z. B. klinisch, Bioproben, Genexpression und Mutation) zusammen und erleichtern so den Zugang und die Analyse.

ISB-CGC hat auch BigQuery-Tabellen für andere Krebsprogramme erstellt. Weitere Informationen finden Sie in der Dokumentation zu ISB-CGC-Programmen.

ISB-CGC bietet auch Notebook-Beispiele in R und Python, die von einfachen bis zu komplexen Abfrageerstellungen und -analysen mithilfe von ISB-CGC-BigQuery-Tabellen reichen:

Dataset-Zugriff

Cloud Storage-Ordner

ISB-CGC speichert Cloud-Speicherpfade zu TCGA-Daten, die vom National Cancer Institute's Genomic Data Commons gehostet werden, in dem BigQuery-Datensatz isb-cgc-bq.GDC_case_file_metadata. In der TCGA-Dokumentation von ISB-CGC um herauszufinden, wie Sie auf diese Dateispeicherorte zugreifen können.

BigQuery-Datasets

Zur Untersuchung und Abfrage von Daten können Sie in BigQuery auf folgende TCGA-Datasets zugreifen:

Verwenden Sie das ISB-CGC BigQuery-Suchtool, um andere ISB-CGC-Krebs-Datasets zu entdecken. Diese Daten finden Sie im Projekt isb-cgc-bq in Google BigQuery. Weitere Informationen zu ISB-CGC und dessen Daten finden Sie in der ISB-CGC-Dokumentation.

Über die Daten

Nutzung: Dieses Dataset ist öffentlich verfügbar und kann gemäß den von der Dataset-Quelle (https://cancergenome.nih.gov/) bereitgestellten Bedingungen genutzt werden. Das Dataset wird "IM IST-ZUSTAND" ohne ausdrückliche oder stillschweigende Garantie von Google bereitgestellt. Google lehnt jegliche Haftung für direkte oder indirekte Schäden ab, die aus der Nutzung des Datasets resultieren.