Variant Transforms は、Cloud Life Sciences で使用されるオープンソースのツールです。これは Apache Beam に基づいており、Dataflow を使用します。
Variant Transforms は、スケーラブルに以下のものを変換して読み込むために使用できます。
- 数十万のファイル
- 数百万のサンプル
- 数十億のレコード
Variant Transforms プリプロセッサは、VCF ファイルを検証して不整合を特定するために使用できます。
このツールを使用する場合の典型的なワークフローは、これらの手順からなります。
- 未加工の VCF ファイルを Cloud Storage に保存する。
- Variant Transforms ツールを使用して、Cloud Storage から BigQuery に VCF ファイルを読み込む。
その後、BigQuery を使用してバリアントを分析できます。
ツールが VCF ファイルを BigQuery テーブルに読み込む方法を理解するには、BigQuery のバリアント スキーマに精通している必要があります。