Questa pagina descrive come copiare e archiviare file VCF non elaborati in Cloud Storage. Dopo aver archiviato i file VCF non elaborati, puoi utilizzare lo strumento Variant Transforms per caricarli in BigQuery.
Copiare i dati in Cloud Storage
Cloud Life Sciences ospita un set di dati pubblico contenente i dati di
Illumina Platinum Genomes.
Per copiare due file VCF dal set di dati al bucket, utilizza il comando
gcloud storage cp
:
gcloud storage cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.
Copiare le varianti da un file system locale
Per copiare un gruppo di file locali nella directory corrente, esegui il comando gcloud storage cp
:
gcloud storage cp *.vcf gs://BUCKET/vcf/
Sostituisci BUCKET con il nome del tuo bucket Cloud Storage.
Per copiare una directory locale di file, esegui il seguente comando:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive
Sostituisci quanto segue:
- VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
- BUCKET: il nome del bucket Cloud Storage
Se si verificano errori a causa di problemi di rete temporanei, puoi eseguire di nuovo i comandi precedenti utilizzando il flag no-clobber (-n
), che copia solo i file mancanti:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \ --recursive --no-clobber
Sostituisci quanto segue:
- VCF_FILE_DIRECTORY: il percorso della directory locale contenente i file VCF
- BUCKET: il nome del bucket Cloud Storage
Per ulteriori informazioni sulla copia dei dati in Cloud Storage, consulta Utilizzo di Cloud Storage con i big data.