Il set di dati 1000 genomi comprende circa 2500 genomi di 25 popolazioni in tutto il mondo. Per informazioni dettagliate, visita il sito web del progetto 1000 genomi e le seguenti pubblicazioni:
Pubblicazione pilota: una mappa integrata delle variazioni genetiche da 1092 genomi umani
Pubblicazione di fase 1: una mappa della variazione del genoma umano dalla sequenza su scala demografica
Pubblicazioni di fase 3:
Accesso a set di dati
Cartelle Cloud Storage
I seguenti file sono disponibili nel bucket Cloud Storage genomics-public-data
:
- Dati di 1000 genomi: gs://genomics-public-data/1000-genomes
- Dati della fase 3 dei 1000 genomi: gs://genomics-public-data/1000-genomes-phase-3
- Un mirroring completo di https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ è disponibile in gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/
Set di dati BigQuery
Puoi accedere ai seguenti set di dati in BigQuery per l'esplorazione dei dati e l'esecuzione di query:
- Varianti della fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informazioni di esempio: bigquery-public-data:umano_genome_varianti.1000_genomes_sample_info
- Pedigree: bigquery-public-data:umano_genome_varianti.1000_genomes_pedigree
Informazioni sul set di dati
Origine set di dati:
- Il set di dati delle varianti della fase 1 è ospitato dal sito FTP di EBI.
- Il set di dati delle varianti della fase 3 è ospitato dal sito FTP di EBI.
Utilizzo: questi set di dati sono disponibili pubblicamente per chiunque all'uso ai sensi dei termini forniti dall'origine del set di dati (http://www.Internationalgenome.org/data) e sono forniti "così come sono", senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso dei set di dati.