Variant Transforms 工具

Variant Transforms 是一种与 Cloud Life Sciences 一起使用的开源工具。它基于 Apache Beam 并使用 Dataflow

您可以使用 Variant Transforms 以可扩缩的方式转换和加载以下内容:

  • 数十万个文件
  • 数百万个样本
  • 数十亿条记录

您可以使用 Variant Transforms 的预处理器验证 VCF 文件并识别不一致性。

使用该工具时,典型的工作流程包括以下步骤:

  1. 在 Cloud Storage 中存储原始 VCF 文件
  2. 使用 Variant Transforms 工具将 Cloud Storage 中的 VCF 文件加载到 BigQuery 中。

然后,您可以使用 BigQuery 来分析变体

您应该掌握 BigQuery 变体架构,以了解该工具如何将 VCF 文件加载到 BigQuery 表格中。