未加工の VCF ファイルを Cloud Storage に保存する

このページでは、未加工の VCF ファイルを Cloud Storage にコピーして保存する方法を説明します。未加工の VCF ファイルを保存した後、Variant Transforms ツールを使用して、それらを BigQuery に読み込むことができます。

Cloud Storage へデータをコピーする

Cloud Life Sciences は、Illumina Platinum Genomes のデータを含む公開データセットをホストします。 2 つの VCF ファイルをデータセットからバケットにコピーするには、gsutil cp コマンドを使用します。

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

BUCKET は、Cloud Storage バケットの名前に置き換えます。

バリアントをローカル ファイル システムからコピーする

現在のディレクトリにあるローカル ファイルのグループをコピーするには、gsutil cp コマンドを実行します。

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

BUCKET は、Cloud Storage バケットの名前に置き換えます。

ファイルのローカル ディレクトリをコピーするには、次のコマンドを実行します。

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

以下を置き換えます。

  • VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
  • BUCKET: Cloud Storage バケットの名前

一時的なネットワークの問題が原因でエラーが発生した場合は、前述のコマンドを再実行するときに上書きなしフラグ(-n)を指定します。これで、まだコピーされていないファイルだけがコピーされます。

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

以下を置き換えます。

  • VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
  • BUCKET: Cloud Storage バケットの名前

Cloud Storage へのデータのコピーに関する詳細情報については、Cloud Storage とビッグデータの使用をご覧ください。