Variant Transforms ツール

Variant Transforms は、Cloud Life Sciences で使用されるオープンソースのツールです。これは Apache Beam に基づいており、Dataflow を使用します。

Variant Transforms を使用することで、スケーラブルに、数十万のファイル、数百万のサンプル、数十億のレコードを変換して読み込めます。Variant Transforms プリプロセッサは、VCF ファイルを検証して不整合を特定するために使用できます。

このツールを使用する典型的なワークフローは、次のとおりです。

  1. 未加工の VCF ファイルを Cloud Storage に保存する。
  2. Variant Transforms ツールを使用して、Cloud Storage から BigQuery に VCF ファイルを読み込む。

その後、BigQuery を使用してバリアントを分析できます。

ツールが VCF ファイルを BigQuery テーブルに読み込む方法を理解するには、BigQuery のバリアント スキーマに精通している必要があります。