未加工の VCF ファイルを Cloud Storage に保存する

このページでは、未加工の VCF ファイルを Cloud Storage にコピーして保存する方法を説明します。未加工の VCF ファイルを保存した後、Variant Transforms ツールを使用して、それらを BigQuery に読み込むことができます。

Cloud Storage へデータをコピーする

Cloud Life Sciences は、Illumina Platinum Genomes のデータを含む公開データセットをホストします。 2 つの VCF ファイルをデータセットからバケットにコピーするには、gcloud storage cp コマンドを使用します。

gcloud storage cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

BUCKET は、Cloud Storage バケットの名前に置き換えます。

バリアントをローカル ファイル システムからコピーする

現在のディレクトリ内のローカル ファイルのグループをコピーするには、gcloud storage cp コマンドを実行します。

gcloud storage cp *.vcf gs://BUCKET/vcf/

BUCKET は、Cloud Storage バケットの名前に置き換えます。

ファイルのローカル ディレクトリをコピーするには、次のコマンドを実行します。

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive

以下を置き換えます。

  • VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
  • BUCKET: Cloud Storage バケットの名前

一時的なネットワークの問題が原因でエラーが発生した場合は、前述のコマンドを再実行するときに上書きなしフラグ(-n)を指定します。これで、まだコピーされていないファイルだけがコピーされます。

gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \
    --recursive --no-clobber

以下を置き換えます。

  • VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
  • BUCKET: Cloud Storage バケットの名前

Cloud Storage へのデータのコピーに関する詳細情報については、Cloud Storage とビッグデータの使用をご覧ください。