このページでは、未加工の VCF ファイルを Cloud Storage にコピーして保存する方法を説明します。未加工の VCF ファイルを保存した後、Variant Transforms ツールを使用して、それらを BigQuery に読み込むことができます。
Cloud Storage へデータをコピーする
Cloud Life Sciences は、Illumina Platinum Genomes のデータを含む公開データセットをホストします。
2 つの VCF ファイルをデータセットからバケットにコピーするには、gcloud storage cp
コマンドを使用します。
gcloud storage cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
BUCKET は、Cloud Storage バケットの名前に置き換えます。
バリアントをローカル ファイル システムからコピーする
現在のディレクトリ内のローカル ファイルのグループをコピーするには、gcloud storage cp
コマンドを実行します。
gcloud storage cp *.vcf gs://BUCKET/vcf/
BUCKET は、Cloud Storage バケットの名前に置き換えます。
ファイルのローカル ディレクトリをコピーするには、次のコマンドを実行します。
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive
以下を置き換えます。
- VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
- BUCKET: Cloud Storage バケットの名前
一時的なネットワークの問題が原因でエラーが発生した場合は、前述のコマンドを再実行するときに上書きなしフラグ(-n
)を指定します。これで、まだコピーされていないファイルだけがコピーされます。
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \ --recursive --no-clobber
以下を置き換えます。
- VCF_FILE_DIRECTORY: VCF ファイルを含むローカル ディレクトリへのパス
- BUCKET: Cloud Storage バケットの名前
Cloud Storage へのデータのコピーに関する詳細情報については、Cloud Storage とビッグデータの使用をご覧ください。