Halaman ini menjelaskan cara menyalin dan menyimpan file VCF mentah di Cloud Storage. Setelah menyimpan file VCF mentah, Anda dapat menggunakan alat Variant Transforms untuk memuat file tersebut ke BigQuery.
Menyalin data ke Cloud Storage
Cloud Life Sciences menghosting set data publik yang berisi data dari
Illumina Platinum Genomes.
Untuk menyalin dua file VCF dari set data ke bucket Anda, gunakan perintah gcloud storage cp
:
gcloud storage cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
Ganti BUCKET dengan nama bucket Cloud Storage Anda.
Menyalin varian dari sistem file lokal
Untuk menyalin sekelompok file lokal di direktori saat ini, jalankan perintah gcloud storage cp
:
gcloud storage cp *.vcf gs://BUCKET/vcf/
Ganti BUCKET dengan nama bucket Cloud Storage Anda.
Untuk menyalin direktori file lokal, jalankan perintah berikut:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive
Ganti kode berikut:
- VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
- BUCKET: nama bucket Cloud Storage Anda
Jika terjadi kegagalan karena masalah jaringan sementara, Anda dapat menjalankan ulang
perintah sebelumnya menggunakan flag no-clobber (-n
), yang hanya menyalin
file yang tidak ada:
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \ --recursive --no-clobber
Ganti kode berikut:
- VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
- BUCKET: nama bucket Cloud Storage Anda
Untuk mengetahui informasi selengkapnya tentang cara menyalin data ke Cloud Storage, lihat Menggunakan Cloud Storage dengan Big Data.