Halaman ini menjelaskan cara menyalin dan menyimpan file VCF mentah di Cloud Storage. Setelah menyimpan file VCF mentah, Anda dapat menggunakan alat Variant Transforms untuk memuatnya ke BigQuery.
Menyalin data ke Cloud Storage
Cloud Life Sciences menghosting set data publik yang berisi data dari Illumina Platinum Genomes.
Untuk menyalin dua file VCF dari set data ke bucket Anda, gunakan perintah gsutil cp
:
gsutil cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
Ganti BUCKET dengan nama bucket Cloud Storage Anda.
Menyalin varian dari sistem file lokal
Untuk menyalin grup file lokal di direktori saat ini, jalankan perintah gsutil cp
:
gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \ gs://BUCKET/vcf/
Ganti BUCKET dengan nama bucket Cloud Storage Anda.
Untuk menyalin direktori lokal file, jalankan perintah berikut:
gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \ VCF_FILE_DIRECTORY/ \ gs://BUCKET/vcf/
Ganti kode berikut:
- VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
- BUCKET: nama bucket Cloud Storage Anda
Jika terjadi kegagalan karena masalah jaringan sementara, Anda dapat menjalankan kembali
perintah sebelumnya menggunakan flag no-clobber (-n
), yang hanya menyalin
file yang hilang:
gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \ VCF_FILE_DIRECTORY/ \ gs://BUCKET/vcf/
Ganti kode berikut:
- VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
- BUCKET: nama bucket Cloud Storage Anda
Untuk mengetahui informasi selengkapnya tentang cara menyalin data ke Cloud Storage, baca artikel Menggunakan Cloud Storage dengan Big Data.