Variant Transforms 工具

Variant Transforms 是一种与 Cloud Life Sciences 一起使用的开源工具。它基于 Apache Beam 并使用 Dataflow

使用该工具,您可以以可扩缩的方式转换和加载数十万个文件、数百万个样本和数十亿条记录。该工具还有一个预处理器,您可以使用它来验证 VCF 文件并识别不一致性。

使用该工具的典型工作流包括如下步骤:

  1. 在 Cloud Storage 中存储原始 VCF 文件
  2. 使用 Variant Transforms 工具将 Cloud Storage 中的 VCF 文件加载到 BigQuery 中

然后,您可以使用 BigQuery 来分析变体

您应该掌握 BigQuery 变体架构,以了解该工具如何将 VCF 文件加载到 BigQuery 表格中。