1000 Genomes 데이터세트는 전 세계 25개 모집단의 게놈 약 2,500개로 이루어져 있습니다. 자세한 내용은 1000 Genomes 프로젝트 웹사이트와 다음 논문을 참조하세요.
예비 논문: An integrated map of genetic variation from 1,092 human genomes
1단계 논문: A map of human genome variation from population scale sequencing
3단계 논문:
데이터세트 액세스
Cloud Storage 폴더
다음 파일은 genomics-public-data
Cloud Storage 버킷에서 사용할 수 있습니다.
- 1000 Genomes 데이터: gs://genomics-public-data/1000-genomes
- 1000 Genomes 3단계 데이터: gs://genomics-public-data/1000-genomes-phase-3
- https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/의 전체 미러링은 gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/에서 제공됩니다.
BigQuery 데이터세트
데이터 탐색 및 쿼리를 위해 BigQuery에서 다음 데이터세트에 액세스할 수 있습니다.
- 3단계 변이: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- 샘플 정보: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- 가계도: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
데이터세트 정보
데이터세트 소스:
- 1단계 변이 데이터 세트는 EBI FTP 사이트에서 호스팅됩니다.
- 3단계 변이 데이터 세트는 EBI FTP 사이트에서 호스팅됩니다.
사용: 이 데이터 세트는 데이터 세트 출처(http://www.internationalgenome.org/data)에서 제공하는 약관을 따르는 모든 사용자에게 공개되며 Google의 어떠한 명시적 또는 묵시적인 보증 없이 '있는 그대로' 제공됩니다. Google에서는 데이터세트 사용으로 인해 발생하는 직간접적인 손해에 대해 책임지지 않습니다.