Cloud Life Sciences offre una varietà di set di dati pubblici a cui puoi accedere gratuitamente e integrare nelle tue applicazioni. Google ospita questi set di dati, fornendo accesso pubblico ai dati tramite i seguenti metodi:
L'accesso interattivo è disponibile nella console di BigQuery. Puoi esplorare le chiamate delle varianti nell'analisi caso/controllo e di coorte. Per iniziare sono disponibili query di esempio. Per informazioni su come iniziare a utilizzare i set di dati pubblici in BigQuery, consulta Set di dati pubblici di BigQuery.
L'accesso ai file è disponibile in Cloud Storage. I file sono disponibili nei formati BAM, VCF e FASTA. Copia i file di cui hai bisogno sul tuo disco locale o su una VM di Compute Engine per l'accesso dagli strumenti bioinformatici preferiti. Per informazioni su come iniziare a utilizzare Cloud Storage, consulta Come utilizzare i set di dati pubblici in Cloud Storage.
Per i dati pubblici ospitati dalla community su Google, ciascun fornitore di dati determina le modalità di accesso che supporta.
Set di dati pubblici genomici di Cloud Life Sciences
- Progetto 1000 Cannabis Genomes
- 1000 genomi
- Database di aggregazione del genoma (gnomAD)
- Illumina i genomi di platino
- Database MSSNG per ricercatori autisti
- Genomi di riferimento
- Progetto Simons Genome Diversity
- Atlante del genoma del cancro (TCGA)
- Ricerca terapeutica applicabile per generare trattamenti efficaci (TARGET)
Set di dati pubblici con annotazione Cloud Life Sciences
- Annotazioni ClinVar
- Annotazioni COSMIC
- Annotazioni Mastermind CVR
- Annotazioni con i toni
- Annotazioni UCSC
Elenca il tuo set di dati pubblico su Cloud Storage
Se hai domande su come elencare un set di dati pubblico in Cloud Storage, contattaci all'indirizzo gcp-public-data@google.com.
Elenca il tuo set di dati pubblico in BigQuery
Se hai domande su come elencare un set di dati pubblico in BigQuery, contattaci all'indirizzo bq-public-data@google.com.