El conjunto de datos de 1,000 genomas abarca cerca de 2,500 genomas de 25 poblaciones de todo el mundo. Consulta el sitio web del Proyecto 1,000 genomas y las publicaciones mencionadas a continuación para obtener más detalles:
Publicación piloto: Un mapa integrado de la variación genética de 1,092 genomas humanos
Publicación de la fase 1: Un mapa de la variación de los genomas humanos de la secuenciación a escala de la población
Publicaciones de la fase 3:
Acceso al conjunto de datos
Carpetas de Cloud Storage
Los siguientes archivos están disponibles en el depósito genomics-public-data
de Cloud Storage:
- Datos de 1,000 Genomes: gs://genomics-public-data/1000-genomes
- Datos de la fase 3 de 1,000 genomas: gs://genomics-public-data/1000-genomes-phase-3
- Existe una duplicación completa de https://ftp-trace.ncbi.nih.gov/1000genomes/ftp/ en gs://genomics-public-data/ftp-trace.ncbi.nih.gov/1000genomes/ftp/
Conjuntos de datos de BigQuery
Puedes acceder a los siguientes conjuntos de datos en BigQuery para explorar y consultar los datos:
- Variantes de la fase 3: bigquery-public-data:human_genome_variants.1000_genomes_phase_3_variants_20150220
- Información de muestra: bigquery-public-data:human_genome_variants.1000_genomes_sample_info
- Familia: bigquery-public-data:human_genome_variants.1000_genomes_pedigree
Acerca del conjunto de datos
Fuente del conjunto de datos:
- El conjunto de datos de las variantes de la fase 1 está alojado en el sitio de FTP del EBI.
- El conjunto de datos de las variantes de la fase 3 está alojado en el sitio de FTP del EBI.
Uso: Estos conjuntos de datos están disponibles públicamente para que los use cualquier persona de conformidad con las condiciones que provee la fuente del conjunto de datos (http://www.internationalgenome.org/data) y se proporcionan "COMO ESTÁN", sin ninguna garantía por parte de Google, ni explícita ni implícita. Google rehúsa toda responsabilidad por cualquier daño, directo o indirecto, como resultado del uso de estos conjuntos de datos.