L'ensemble de données 1000 Genomes comprend environ 2 500 génomes provenant de 25 populations du monde entier. Accédez au site Web du projet "1000 Genomes" et aux publications suivantes pour en savoir plus :
Publication pilote : Carte intégrée de variation génétique de 1 092 génomes humains.
Phase 1 de publication : Carte de variations du génome humain à partir du séquençage à l'échelle d'une population.
Phase 3 de publication :
Accès à l'ensemble de données
Dossiers Cloud Storage
Les fichiers suivants sont disponibles dans le bucket Cloud Storage genomics-public-data
:
- Données 1000 Genomes : gs://genomics-public-data/1000-genomes
- Données 1000 Genomes de Phase 3 : gs://genomics-public-data/1000-genomes-phase-3
- Miroir complet de https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ disponible à l'adresse gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/.
Ensembles de données BigQuery
Vous pouvez accéder aux ensembles de données suivants dans BigQuery pour l'exploration et l'interrogation de données :
- Variantes de Phase 3 : bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Exemple d'information : bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Famille : bigquery-public-data:human_genome_variants.1000_genomes_pedigree
À propos de l'ensemble de données
Source de l'ensemble de données :
- L'ensemble de données des variantes Phase 1 est hébergé sur le site FTP d'EBI.
- L'ensemble de données des variantes Phase 3 est hébergé sur le site FTP d'EBI.
Utilisation : Ces ensembles de données sont accessibles au public selon les conditions définies par leur source (http://www.internationalgenome.org/data). Ils sont fournis "en l'état", sans aucune garantie expresse ou implicite de la part de Google. Google décline toute responsabilité pour tout dommage direct ou indirect résultant de l'utilisation de ces ensembles de données.