1000 Genomes 数据集包括来自世界各地 25 个种群的大约 2500 个人的基因组。如需了解详情,请参阅 1000 Genomes 计划网站和以下出版物:
试点出版物:An integrated map of genetic variation from 1,092 human genomes
第 1 阶段出版物:A map of human genome variation from population scale sequencing
第 3 阶段出版物:
数据集访问
Cloud Storage 文件夹
以下文件位于 genomics-public-data
Cloud Storage 存储分区中:
- 1000 Genomes 数据:gs://genomics-public-data/1000-genomes
- 1000 Genomes 第 3 阶段数据:gs://genomics-public-data/1000-genomes-phase-3
- https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ 的完整镜像可在 gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/ 上找到。
BigQuery 数据集
您可以访问 BigQuery 中的以下数据集以进行数据探索和查询:
- 第 3 阶段变体:bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- 样本信息:bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- 谱系:bigquery-public-data:human_genome_variants.1000_genomes_pedigree
关于数据集
数据集来源:
- 第 1 阶段变体数据集由 EBI FTP 网站托管。
- 第 3 阶段变体数据集由 EBI FTP 网站托管。
使用:此数据集公开提供给所有人使用,但使用者需遵循数据集来源 (http://www.internationalgenome.org/data) 规定的条款;Google“按原样”提供数据集,对此不作任何明示或暗示的保证。对于因使用数据集而导致的任何直接或间接损害,Google 不承担任何责任。