Cloud Life Sciences fornisce una serie di set di dati pubblici a cui puoi accedere gratuitamente e integrarli nelle tue applicazioni. Google ospita questi set di dati, fornendo l'accesso pubblico ai dati tramite i seguenti metodi:
L'accesso interattivo è disponibile nella console BigQuery. Puoi esplorare le chiamate delle varianti nel caso/controllo e analisi di coorte. Sono disponibili query di esempio per iniziare. Per informazioni su come iniziare a utilizzare i set di dati pubblici in BigQuery, consulta Set di dati pubblici di BigQuery.
L'accesso ai file è disponibile da Cloud Storage. I file sono disponibili nei formati BAM, VCF e FASTA. Copia i file necessari sul tuo disco locale o su una VM di Compute Engine per accedere dai tuoi strumenti di bioinformatica preferiti. Per informazioni su come iniziare a utilizzare Cloud Storage, consulta Come utilizzare i set di dati pubblici in Cloud Storage.
Per i dati pubblici ospitati dalla community su Google, ogni fornitore di dati determina le modalità di accesso supportate.
Set di dati pubblici genomici di Cloud Life Sciences
- Progetto 1000 sulla cannabis
- 1000 genomi
- Database di aggregazione del genoma (gnomAD)
- Genomi Grigio Platino
- Database MSSNG per ricercatori autistici
- Genomi di riferimento
- Progetto Simons Genome Diversity
- Il tumore del genoma del cancro (TCGA)
- Ricerca terapeuticamente applicabile per generare trattamenti efficaci (TARGET)
Set di dati pubblici di annotazione Cloud Life Sciences
- Annotazioni ClinVar
- Annotazioni COSMIC
- Annotazioni CVR Mastermind
- Annotazioni precise
- Annotazioni UCSC
Elenca il tuo set di dati pubblico su Cloud Storage
In caso di domande sull'elenco di un set di dati pubblico su Cloud Storage, contattaci all'indirizzo gcp-public-data@google.com.
Elenca il tuo set di dati pubblico su BigQuery
In caso di domande sulla creazione di un set di dati pubblici in BigQuery, contattaci all'indirizzo bq-public-data@google.com.