Il set di dati 1000 Genomes comprende circa 2500 genomi di 25 popolazioni in tutto il mondo. Visita il sito web del 1000 Genomes Project e seguenti pubblicazioni per maggiori dettagli:
Pubblicazione pilota: Una mappa integrata della variabilità genetica di 1092 genomi umani
Pubblicazione della fase 1: Una mappa della variabilità del genoma umano derivante dal sequenziamento su scala di popolazione
Pubblicazioni della fase 3:
Accesso a set di dati
Cartelle di Cloud Storage
I seguenti file sono disponibili nel bucket Cloud Storage genomics-public-data
:
- Dati del progetto 1000 genomi: gs://genomics-public-data/1000-genomes
- Dati di 1000 genomi di fase 3: gs://genomics-public-data/1000-genomes-phase-3
- Un mirror completo di https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ è disponibile in gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/
Set di dati di BigQuery
In BigQuery puoi accedere ai seguenti set di dati per esplorare i dati ed eseguire query:
- Varianti della fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informazioni sui campioni: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Pedigree: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
Informazioni sul set di dati
Origine del set di dati:
- Il set di dati per le varianti della fase 1 è ospitato sul sito FTP di EBI.
- Il set di dati delle varianti della fase 3 è ospitato sul sito FTP dell'EBI.
Utilizzo: questi set di dati sono disponibili pubblicamente e possono essere utilizzati da chiunque ai sensi dei termini forniti dall'origine del set di dati (http://www.internationalgenome.org/data) e sono forniti "COSÌ COM'È" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso dei set di dati.