Das 1.000 Genome-Dataset umfasst rund 2.500 Genome von 25 Populationen auf der ganzen Welt. Ausführliche Informationen finden Sie auf der Website des 1.000 Genome-Projekts und in folgenden Publikationen (nur auf Englisch verfügbar):
Pilotpublikation: An integrated map of genetic variation from 1,092 human genomes
Veröffentlichung der Phase 1: A map of human genome variation from population scale sequencing
Veröffentlichungen der Phase 3:
Dataset-Zugriff
Cloud Storage-Ordner
Die folgenden Dateien sind im Cloud Storage-Bucket genomics-public-data
verfügbar:
- 1000 Genomes-Daten: gs://genomics-public-data/1000-genomes
- 1.000-Genome-Daten der Phase 3: gs://genomics-public-data/1000-genomes-phase-3
- Eine vollständige Kopie von https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ steht unter gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/ zur Verfügung.
BigQuery-Datasets
Zur Untersuchung und Abfrage von Daten können Sie in BigQuery auf folgende Datasets zugreifen:
- Phase 3 variants (Varianten der Phase 3): bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Stichprobeninformationen: bigquery-public-data: human_genome_variants.1000_genomes_sample_info
- Abstammung: bigquery-public-data: human_genome_variants.1000_genomes_pedigree
Über das Dataset
Dataset-Quelle:
- Das Dataset der Varianten der Phase 1 wird auf dem EBI-FTP-Server gehostet.
- Das Dataset der Varianten der Phase 3 wird auf dem EBI-FTP-Server gehostet.
Nutzung: Diese Datasets sind öffentlich verfügbar und können gemäß den von der Dataset-Quelle (http://www.internationalgenome.org/data) bereitgestellten Bedingungen genutzt werden. Das Dataset wird "WIE BESEHEN" ohne ausdrückliche oder konkludente Garantie von Google bereitgestellt. Google lehnt jegliche Haftung für direkte oder indirekte Schäden ab, die aus der Nutzung der Datasets resultieren.