「1,000 人ゲノム」データセットは、世界各地の 25 の母集団から集められた約 2,500 のゲノムで構成されています。詳細については、1,000 人ゲノム プロジェクトのウェブサイトと下記の刊行物をご覧ください。
パイロット刊行物: An integrated map of genetic variation from 1,092 human genomes
フェーズ 1 刊行物: A map of human genome variation from population scale sequencing
フェーズ 3 刊行物:
データセットへのアクセス
Cloud Storage フォルダ
次のファイルは、genomics-public-data
Cloud Storage バケットにあります。
- 1,000 人ゲノムのデータ: gs://genomics-public-data/1000-genomes
- 1,000 人ゲノムフェーズ 3 のデータ: gs://genomics-public-data/1000-genomes-phase-3
- https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ の完全ミラーが gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/ にあります。
BigQuery データセット
データ探索とクエリ用に、BigQuery の次のデータセットにアクセスできます。
- フェーズ 3 バリアント: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- 標本情報: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- 系統: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
データセットについて
データセットのソース:
- フェーズ 1 バリアントのデータセットは EBI FTP サイトでホストされています。
- フェーズ 3 バリアントのデータセットは EBI FTP サイトでホストされています。
使用: これらのデータセットは、データセットのソース(http://www.internationalgenome.org/data)で規定されている条件の下で誰でも利用できるように公開されています。Google はこれらのデータセットを「現状のまま」提供し、明示または黙示を問わず、いかなる保証も行いません。Google は、これらのデータセットの使用で、直接または間接の損害が発生したとしても一切の責任を負いません。