Il set di dati 1000 Genomes comprende circa 2500 genomi di 25 popolazioni in tutto il mondo. Per informazioni dettagliate, consulta il sito web del progetto 1000 Genomes e le seguenti pubblicazioni:
Pubblicazione pilota: Una mappa integrata delle variazioni genetiche da 1092 genomi umani
Pubblicazione della fase 1: una mappa delle variazioni del genoma umano rispetto al sequenziamento della scala della popolazione
Pubblicazioni della fase 3:
Accesso a set di dati
Cartelle di Cloud Storage
I seguenti file sono disponibili nel bucket Cloud Storage genomics-public-data
:
- Dati relativi a 1000 genomi: gs://genomics-public-data/1000-genomes
- Dati di 1000 genomi di fase 3: gs://genomics-public-data/1000-genomes-phase-3
- Un mirroring completo di https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ è disponibile in gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/
Set di dati di BigQuery
Puoi accedere ai seguenti set di dati in BigQuery per l'esplorazione e l'esecuzione di query sui dati:
- Varianti della fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Informazioni di esempio: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Pedigree: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
Informazioni sul set di dati
Origine del set di dati:
- Il set di dati per le varianti della fase 1 è ospitato sul sito FTP di EBI.
- Il set di dati Fase 3 varianti è ospitato sul sito FTP di EBI.
Utilizzo: questi set di dati sono disponibili pubblicamente e possono essere utilizzati da chiunque ai sensi dei termini forniti dall'origine del set di dati (http://www.internationalgenome.org/data) e vengono forniti "così com'è" senza alcuna garanzia, espressa o implicita, da parte di Google. Google esclude qualsiasi responsabilità per eventuali danni, diretti o indiretti, derivati dall'uso dei set di dati.