Menyimpan file VCF mentah di Cloud Storage

Halaman ini menjelaskan cara menyalin dan menyimpan file VCF mentah di Cloud Storage. Setelah menyimpan file VCF mentah, Anda dapat menggunakan alat Variant Transforms untuk memuat file tersebut ke BigQuery.

Menyalin data ke Cloud Storage

Cloud Life Sciences menghosting set data publik yang berisi data dari Illumina Platinum Genomes. Untuk menyalin dua file VCF dari set data ke bucket Anda, gunakan perintah gcloud storage cp:

gcloud storage cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

Ganti BUCKET dengan nama bucket Cloud Storage Anda.

Menyalin varian dari sistem file lokal

Untuk menyalin sekelompok file lokal di direktori saat ini, jalankan perintah gcloud storage cp:

gcloud storage cp *.vcf gs://BUCKET/vcf/

Ganti BUCKET dengan nama bucket Cloud Storage Anda.

Untuk menyalin direktori file lokal, jalankan perintah berikut:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive

Ganti kode berikut:

  • VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
  • BUCKET: nama bucket Cloud Storage Anda

Jika terjadi kegagalan karena masalah jaringan sementara, Anda dapat menjalankan ulang perintah sebelumnya menggunakan flag no-clobber (-n), yang hanya menyalin file yang tidak ada:

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \
    --recursive --no-clobber

Ganti kode berikut:

  • VCF_FILE_DIRECTORY: jalur ke direktori lokal yang berisi file VCF
  • BUCKET: nama bucket Cloud Storage Anda

Untuk mengetahui informasi selengkapnya tentang cara menyalin data ke Cloud Storage, lihat Menggunakan Cloud Storage dengan Big Data.