Tool Variant Transforms

Variant Transforms ist ein Open-Source-Tool, das mit Cloud Life Sciences verwendet wird. Er basiert auf Apache Beam und nutzt Dataflow.

Sie können Variant Transforms verwenden, um Folgendes skalierbar zu transformieren und zu laden:

  • Hunderttausende Dateien
  • Millionen von Proben
  • Milliarden von Datensätzen

Mit dem Präprozessor von Variant Transforms lassen sich VCF-Dateien validieren und Inkonsistenzen feststellen.

Der typische Workflow bei Verwendung des Tools besteht aus folgenden Schritten:

  1. VCF-Rohdatendateien in Cloud Storage speichern
  2. VCF-Dateien mit dem Tool Variant Transforms aus Cloud Storage in BigQuery laden

Anschließend können Sie die Varianten mit BigQuery analysieren.

Machen Sie sich mit dem BigQuery-Variantenschema vertraut, damit Sie wissen, wie das Tool VCF-Dateien in BigQuery-Tabellen lädt.