Cloud Storage への未加工の VCF ファイルの格納

このページでは、未加工の VCF ファイルを Cloud Storage にコピーして保存する方法を説明します。未加工の VCF ファイルを保存した後、Variant Transforms ツールを使用して、それらを BigQuery に読み込むことができます。

データを Cloud Storage にコピーする

Cloud Genomics は、Illumina Platinum Genomes からのデータが格納されている一般公開データセットをホストしています。このデータセットから 2 つの VCF ファイルを自分のバケットにコピーする方法は次のとおりです。

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

バリアントをローカル ファイル システムからコピーする

複数のローカル ファイルをまとめてコピーするには:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

特定のローカル ディレクトリのファイルをまとめてコピーするには:

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

一時的なネットワークの問題が原因でエラーが発生した場合は、前述のコマンドを再実行するときに上書きなしフラグ(-n)を指定します。これで、まだコピーされていないファイルだけがコピーされます。

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY \
    gs://BUCKET/vcf/

Cloud Storage へのデータのコピーに関する詳細情報については、Cloud Storage とビッグデータの使用をご覧ください。

次のステップ

Variant Transforms ツールを使用して、VCF ファイルを BigQuery に読み込みます。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...