Archivia file VCF non elaborati in Cloud Storage

In questa pagina viene descritto come copiare e archiviare i file VCF non elaborati Cloud Storage. Dopo aver memorizzato i file VCF non elaborati, puoi utilizzare Strumento di trasformazione delle varianti per caricarli in BigQuery.

Copia i dati in Cloud Storage

Cloud Life Sciences ospita un set di dati pubblico contenente dati provenienti Illumina i genomi di platino. Per copiare due file VCF dal set di dati nel bucket, utilizza Comando gsutil cp:

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Copia delle varianti da un file system locale

Per copiare un gruppo di file locali nella directory corrente, esegui il comando gsutil cp:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Per copiare una directory locale di file, esegui questo comando:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del tuo bucket Cloud Storage

Se si verificano errori dovuti a problemi di rete temporanei, puoi eseguire nuovamente i comandi precedenti utilizzando il flag no-clobber (-n), che copia solo file mancanti:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del tuo bucket Cloud Storage

Per ulteriori informazioni sulla copia dei dati in Cloud Storage, consulta Utilizzare Cloud Storage con big data.