이 페이지에서는 Cloud Storage에서 원시 VCF 파일을 복사하고 저장하는 방법을 설명합니다. 원시 VCF 파일을 저장한 후 Variant Transforms 도구를 사용하여 BigQuery로 로드할 수 있습니다.
Cloud Storage에 데이터 복사
Cloud Life Sciences는 Illumina Platinum Genomes의 데이터를 포함하는 공용 데이터세트를 호스팅합니다.
두 VCF 파일을 데이터세트에서 버킷으로 복사하려면 gcloud storage cp
명령어를 사용합니다.
gcloud storage cp \ gs://genomics-public-data/platinum-genomes/vcf/NA1287*_S1.genome.vcf \ gs://BUCKET/platinum-genomes/vcf/
BUCKET을 Cloud Storage 버킷의 이름으로 바꿉니다.
로컬 파일 시스템에서 변이 파일 복사
현재 디렉터리에 로컬 파일 그룹을 복사하려면 gcloud storage cp
명령어를 실행합니다.
gcloud storage cp *.vcf gs://BUCKET/vcf/
BUCKET을 Cloud Storage 버킷의 이름으로 바꿉니다.
파일의 로컬 디렉터리를 복사하려면 다음 명령어를 실행합니다.
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ --recursive
다음을 바꿉니다.
- VCF_FILE_DIRECTORY: VCF 파일이 포함된 로컬 디렉터리의 경로
- BUCKET: Cloud Storage 버킷 이름
임시 네트워크 문제로 인해 오류가 발생하면 누락된 파일만 복사하는 no-clobber(-n
) 플래그를 사용하여 이전 명령어를 다시 실행할 수 있습니다.
gcloud storage cp VCF_FILE_DIRECTORY/ gs://BUCKET/vcf/ \ --recursive --no-clobber
다음을 바꿉니다.
- VCF_FILE_DIRECTORY: VCF 파일이 포함된 로컬 디렉터리의 경로
- BUCKET: Cloud Storage 버킷 이름
데이터를 Cloud Storage에 복사하는 방법에 대한 자세한 내용은 빅데이터를 통한 Cloud Storage 사용을 참조하세요.