Il set di dati di 1000 genomi comprende circa 2500 genomi di 25 popolazioni di tutto il mondo. Consulta il sito web del progetto 1000 Genomes e le seguenti pubblicazioni per informazioni dettagliate:
Pubblicazione pilota: Una mappa integrata delle variazioni genetiche di 1092 genomi umani
Pubblicazione di Fase 1: A map of the human genoma deviing from population sequencing"
Fase 3: pubblicazioni:
Accesso a set di dati
Cartelle di Cloud Storage
Nel bucket Cloud Storage genomics-public-data
sono disponibili i seguenti file:
- Dati di 1000 genomi: gs://genomics-public-data/1000-genomes
- Dati di 1000 genomi di fase 3: gs://genomics-public-data/1000-genomes-phase-3
- Un mirror completo di https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ è disponibile in gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/.
Set di dati di BigQuery
Puoi accedere ai seguenti set di dati in BigQuery per esplorare i dati ed eseguire query:
- Varianti della fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informazioni di esempio: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Pedigree: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
Informazioni sul set di dati
Origine del set di dati:
- Il set di dati delle varianti di fase 1 è ospitato dal sito FTP di EBI.
- Il set di dati delle varianti di fase 3 è ospitato dal sito FTP di EBI.
Utilizzo: questi set di dati sono disponibili pubblicamente per l'utilizzo da parte di chiunque nel rispetto dei termini indicati dall'origine del set di dati (http://www.internationalgenome.org/data) e sono forniti "così com'è", senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso dei set di dati.