Variant Transforms ツール

Variant Transforms は、Cloud Life Sciences で使用されるオープンソースのツールです。これは Apache Beam に基づいており、Dataflow を使用します。

Variant Transforms は、スケーラブルに以下のものを変換して読み込むために使用できます。

  • 数十万のファイル
  • 数百万のサンプル
  • 数十億のレコード

Variant Transforms プリプロセッサは、VCF ファイルを検証して不整合を特定するために使用できます。

このツールを使用する場合の典型的なワークフローは、これらの手順からなります。

  1. 未加工の VCF ファイルを Cloud Storage に保存する。
  2. Variant Transforms ツールを使用して、Cloud Storage から BigQuery に VCF ファイルを読み込む。

その後、BigQuery を使用してバリアントを分析できます。

ツールが VCF ファイルを BigQuery テーブルに読み込む方法を理解するには、BigQuery のバリアント スキーマに精通している必要があります。