Cloud Storage에 원시 VCF 파일 저장

이 페이지에서는 Cloud Storage에서 원시 VCF 파일을 복사하고 저장하는 방법을 설명합니다. 원시 VCF 파일을 저장한 후 Variant Transforms 도구를 사용하여 BigQuery로 로드할 수 있습니다.

Cloud Storage에 데이터 복사

Cloud Life Sciences는 Illumina Platinum Genomes의 데이터를 포함하는 공용 데이터세트를 호스팅합니다. 두 VCF 파일을 데이터세트에서 버킷으로 복사하려면 gsutil cp 명령어를 사용합니다.

gsutil cp \
    gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \
    gs://BUCKET/platinum-genomes/vcf/

BUCKET을 Cloud Storage 버킷의 이름으로 바꿉니다.

로컬 파일 시스템에서 변이 파일 복사

현재 디렉터리에 로컬 파일 그룹을 복사하려면 gsutil cp 명령어를 실행합니다.

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp *.vcf \
    gs://BUCKET/vcf/

BUCKET을 Cloud Storage 버킷의 이름으로 바꿉니다.

파일의 로컬 디렉터리를 복사하려면 다음 명령어를 실행합니다.

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

다음을 바꿉니다.

  • VCF_FILE_DIRECTORY: VCF 파일이 포함된 로컬 디렉터리의 경로
  • BUCKET: Cloud Storage 버킷 이름

임시 네트워크 문제로 인해 오류가 발생하면 누락된 파일만 복사하는 no-clobber(-n) 플래그를 사용하여 이전 명령어를 다시 실행할 수 있습니다.

gsutil -m -o 'GSUtil:parallel_composite_upload_threshold=150M' cp -n -R \
    VCF_FILE_DIRECTORY/ \
    gs://BUCKET/vcf/

다음을 바꿉니다.

  • VCF_FILE_DIRECTORY: VCF 파일이 포함된 로컬 디렉터리의 경로
  • BUCKET: Cloud Storage 버킷 이름

데이터를 Cloud Storage에 복사하는 방법에 대한 자세한 내용은 빅데이터를 통한 Cloud Storage 사용을 참조하세요.