Variant Transforms는 Cloud Life Sciences와 함께 사용되는 오픈소스 도구입니다. 이 도구는 Apache Beam을 기반으로 하고 Dataflow를 사용합니다.
Variant Transforms를 사용하여 다음과 같은 확장 가능한 방식으로 변환 및 로드할 수 있습니다.
- 수십만 개의 파일
- 수백만 개의 샘플
- 수십억 개의 레코드
Variant Transforms 전처리기를 사용하여 VCF 파일의 유효성을 검사하고 불일치를 식별할 수 있습니다.
이 도구 사용 시 일반적인 워크플로는 다음과 같은 단계로 구성됩니다.
- Cloud Storage에 원시 VCF 파일 저장
- Variant Transforms 도구를 사용하여 Cloud Storage에서 BigQuery로 VCF 파일 로드
그런 다음 BigQuery를 사용하여 변이를 분석합니다.
도구가 BigQuery 테이블에 VCF 파일을 로드하는 방식에 대한 자세한 내용은 BigQuery 변이 스키마를 참조하세요.