Archivia file VCF non elaborati in Cloud Storage

In questa pagina viene descritto come copiare e archiviare i file VCF non elaborati Cloud Storage. Dopo aver archiviato i file VCF non elaborati, puoi utilizzare lo strumento Variant Transforms per caricarli in BigQuery.

Copia i dati in Cloud Storage

Cloud Life Sciences ospita un set di dati pubblico contenente i dati di Illumina Platinum Genomes. Per copiare due file VCF dal set di dati nel bucket, utilizza Comando gcloud storage cp:

gcloud storage cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Copiare le varianti da un file system locale

Per copiare un gruppo di file locali nella directory corrente, esegui il comando gcloud storage cp:

gcloud storage cp *.vcf gs://BUCKET/vcf/

Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.

Per copiare una directory locale di file, esegui il seguente comando:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del bucket Cloud Storage

Se si verificano errori dovuti a problemi di rete temporanei, puoi eseguire nuovamente i comandi precedenti utilizzando il flag no-clobber (-n), che copia solo file mancanti:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \
    --recursive --no-clobber

Sostituisci quanto segue:

  • VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
  • BUCKET: il nome del tuo bucket Cloud Storage

Per ulteriori informazioni sulla copia dei dati in Cloud Storage, consulta Utilizzare Cloud Storage con big data.