Tool Variant Transforms

Variant Transforms ist ein Open Source-Tool, das mit Cloud Life Sciences verwendet wird. Er basiert auf Apache Beam und nutzt Dataflow.

Sie können Variant Transforms verwenden, um Folgendes auf skalierbare Weise zu transformieren und zu laden:

  • Hunderttausende von Dateien
  • Millionen von Beispielen
  • Milliarden von Einträgen

Mit dem Präprozessor von Variant Transforms können Sie VCF-Dateien prüfen und Inkonsistenzen feststellen.

Der typische Workflow bei der Verwendung des Tools besteht aus diesen Schritten:

  1. VCF-Rohdatendateien in Cloud Storage speichern
  2. VCF-Dateien mit dem Tool Variant Transforms aus Cloud Storage in BigQuery laden

Anschließend können Sie die Varianten mit BigQuery analysieren.

Machen Sie sich mit dem BigQuery-Variantenschema vertraut, damit Sie wissen, wie das Tool VCF-Dateien in BigQuery-Tabellen lädt.