Variant Transforms 도구

Variant Transforms는 Cloud Life Sciences와 함께 사용되는 오픈소스 도구입니다. 이 도구는 Apache Beam을 기반으로 하고 Dataflow를 사용합니다.

Variant Transforms를 사용하여 다음과 같은 확장 가능한 방식으로 변환 및 로드할 수 있습니다.

  • 수십만 개의 파일
  • 수백만 개의 샘플
  • 수십억 개의 레코드

Variant Transforms 전처리기를 사용하여 VCF 파일의 유효성을 검사하고 불일치를 식별할 수 있습니다.

이 도구 사용 시 일반적인 워크플로는 다음과 같은 단계로 구성됩니다.

  1. Cloud Storage에 원시 VCF 파일 저장
  2. Variant Transforms 도구를 사용하여 Cloud Storage에서 BigQuery로 VCF 파일 로드

그런 다음 BigQuery를 사용하여 변이를 분석합니다.

도구가 BigQuery 테이블에 VCF 파일을 로드하는 방식에 대한 자세한 내용은 BigQuery 변이 스키마를 참조하세요.