Almacena archivos VCF sin procesar en Cloud Storage

En esta página, se describe cómo copiar y almacenar archivos VCF sin procesar en Cloud Storage. Después de almacenar archivos VCF sin procesar, puedes utilizar la herramienta Variant Transforms para cargarlos en BigQuery.

Copia datos en Cloud Storage

Cloud Life Sciences aloja un conjunto de datos públicos que contiene datos de Platinum Genomes de Illumina. Para copiar dos archivos VCF del conjunto de datos en tu depósito:

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Cómo copiar variantes desde un sistema de archivos local

Para copiar un grupo de archivos locales:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

Para copiar un directorio local de archivos:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

Si se produce algún error debido a problemas temporales de red, puedes volver a ejecutar los comandos anteriores con la marca no-clobber (-n), que copia solamente los archivos faltantes:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY \
    gs://BUCKET/vcf/

Para obtener más información sobre cómo copiar datos en Cloud Storage, consulta Cómo usar Cloud Storage con macrodatos.

¿Qué sigue?

Utiliza la herramienta Variant Transforms para cargar los archivos VCF en BigQuery.

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Cloud Life Sciences