Cloud Life Sciences offre una varietà di set di dati pubblici che puoi l'accesso gratuito e l'integrazione nelle tue applicazioni. Google ospita questi di dati, fornendo accesso pubblico ai dati attraverso i seguenti metodi:
L'accesso interattivo è disponibile nella Console BigQuery. Puoi esplorare le chiamate delle varianti nell'analisi caso/controllo e coorte. Sono disponibili query di esempio per aiutarti per iniziare. Per informazioni su come ottenere hanno iniziato con set di dati pubblici in BigQuery, vedi Set di dati pubblici BigQuery.
L'accesso ai file è disponibile in Cloud Storage. File sono disponibili nei formati BAM, VCF e FASTA. Copia i file che ti servono il tuo disco locale o una VM di Compute Engine per l'accesso dal tuo i tuoi strumenti bioinformatici preferiti. Per informazioni su come iniziare a utilizzare Cloud Storage, consulta Come utilizzare i set di dati Cloud Storage.
Per i dati pubblici ospitati dalla community su Google, ogni fornitore di dati determinano le modalità di accesso supportate.
Set di dati pubblici genomici di Cloud Life Sciences
- Progetto 1000 Cannabis Genomes
- 1000 genomi
- Database di aggregazione del genoma (gnomAD)
- Illumina i genomi di platino
- Database MSSNG per ricercatori autisti
- Genomi di riferimento
- Progetto Simons Genome Diversity
- Atlante del genoma del cancro (TCGA)
- Ricerca terapeutica applicabile per generare trattamenti efficaci (TARGET)
Set di dati pubblici con annotazione Cloud Life Sciences
- Annotazioni ClinVar
- Annotazioni COSMIC
- Annotazioni Mastermind CVR
- Annotazioni con i toni
- Annotazioni UCSC
Elenca il tuo set di dati pubblico su Cloud Storage
Se hai domande su come elencare un set di dati pubblico su Cloud Storage, contattaci all'indirizzo gcp-public-data@google.com.
Elenca il tuo set di dati pubblico in BigQuery
Per eventuali domande su come elencare un set di dati pubblico in BigQuery, contattaci all'indirizzo bq-public-data@google.com