Archiviare file VCF non elaborati in Cloud Storage

Questa pagina descrive come copiare e archiviare file VCF non elaborati in Cloud Storage. Dopo aver archiviato i file VCF non elaborati, puoi utilizzare lo strumento Variant Transforms per caricarli in BigQuery.

Copiare i dati in Cloud Storage

Cloud Life Sciences ospita un set di dati pubblico contenente i dati di Illumina Platinum Genomes. Per copiare due file VCF dal set di dati al bucket, utilizza il comando gcloud storage cp:

gcloud storage cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Copiare le varianti da un file system locale

Per copiare un gruppo di file locali nella directory corrente, esegui il comando gcloud storage cp:

gcloud storage cp *.vcf gs://BUCKET/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Per copiare una directory locale di file, esegui il seguente comando:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del bucket Cloud Storage

Se si verificano errori a causa di problemi di rete temporanei, puoi eseguire di nuovo i comandi precedenti utilizzando il flag no-clobber (-n), che copia solo i file mancanti:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \
    --recursive --no-clobber

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del bucket Cloud Storage

Per ulteriori informazioni sulla copia dei dati in Cloud Storage, consulta Utilizzo di Cloud Storage con i big data.