Il set di dati 1000 Genomes comprende circa 2.500 genomi di 25 popolazioni in tutto il mondo. Visita il sito web del 1000 Genomes Project e seguenti pubblicazioni per maggiori dettagli:
Pubblicazione pilota: Una mappa integrata delle variazioni genetiche da 1092 genomi umani
Pubblicazione della fase 1: una mappa delle variazioni del genoma umano rispetto al sequenziamento della scala della popolazione
Pubblicazioni della fase 3:
Accesso a set di dati
Cartelle di Cloud Storage
I seguenti file sono disponibili in genomics-public-data
Bucket Cloud Storage:
- Dati relativi a 1000 genomi: gs://genomics-public-data/1000-genomes
- Dati di 1000 genomi di fase 3: gs://genomics-public-data/1000-genomes-phase-3
- Un mirror completo di https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ è disponibile in gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/
Set di dati di BigQuery
In BigQuery puoi accedere ai seguenti set di dati dell'esplorazione e delle query:
- Varianti della fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informazioni di esempio: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Pedigree: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
Informazioni sul set di dati
Origine del set di dati:
- Il set di dati per le varianti della fase 1 è ospitato sul sito FTP di EBI.
- Il set di dati Fase 3 varianti è ospitato sul sito FTP di EBI.
Utilizzo: questi set di dati sono disponibili pubblicamente e possono essere utilizzati da chiunque ai sensi delle Termini forniti dall'origine del set di dati (http://www.internationalgenome.org/data) e sono forniti "così com'è" senza alcuna garanzia, espressa o implicita, da in tutti i canali Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivanti dall'uso dei set di dati.