Cloud Life Sciences offre una varietà di set di dati pubblici che puoi l'accesso gratuito e l'integrazione nelle tue applicazioni. Google ospita questi di dati, fornendo accesso pubblico ai dati attraverso i seguenti metodi:
L'accesso interattivo è disponibile nella console BigQuery. Puoi esplorare le chiamate delle varianti nell'analisi caso/controllo e coorte. Sono disponibili query di esempio per aiutarti per iniziare. Per informazioni su come iniziare a utilizzare i set di dati pubblici in BigQuery, consulta Set di dati pubblici di BigQuery.
L'accesso ai file è disponibile in Cloud Storage. I file sono disponibili nei formati BAM, VCF e FASTA. Copia i file di cui hai bisogno sul tuo disco locale o su una VM Compute Engine per accedervi dai tuoi strumenti di bioinformatica preferiti. Per informazioni su come iniziare a utilizzare Cloud Storage, consulta Come utilizzare i set di dati Cloud Storage.
Per i dati pubblici ospitati dalla community su Google, ogni fornitore di dati determina le modalità di accesso supportate.
Set di dati pubblici genomici di Cloud Life Sciences
- Progetto 1000 Cannabis Genomes
- 1000 genomi
- Database di aggregazione del genoma (gnomAD)
- Illumina Platinum Genomes
- Database MSSNG per ricercatori autisti
- Genomi di riferimento
- Progetto Simons Genome Diversity
- The Cancer Genome Atlas (TCGA)
- Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Set di dati pubblici con annotazione Cloud Life Sciences
- Annotazioni ClinVar
- Annotazioni COSMIC
- Annotazioni Mastermind CVR
- Annotazioni con i toni
- Annotazioni UCSC
Elenca il tuo set di dati pubblico su Cloud Storage
Se hai domande sull'elenco di un set di dati pubblico su Cloud Storage, contattaci all'indirizzo gcp-public-data@google.com.
Elenca il tuo set di dati pubblico in BigQuery
Per eventuali domande su come elencare un set di dati pubblico in BigQuery, contattaci all'indirizzo bq-public-data@google.com