Variant Transforms adalah alat open source yang digunakan dengan Cloud Life Sciences. API ini didasarkan pada Apache Beam dan menggunakan Dataflow.
Anda dapat menggunakan Variant Transforms untuk mengubah dan memuat elemen berikut secara skalabel:
- Ratusan ribu file
- Jutaan sampel
- Miliaran data
Anda dapat menggunakan preprocessor Variant Transforms untuk memvalidasi file VCF dan mengidentifikasi inkonsistensi.
Alur kerja umum saat menggunakan alat ini terdiri dari langkah-langkah berikut:
- Menyimpan file VCF mentah di Cloud Storage.
- Menggunakan alat Variant Transforms untuk memuat file VCF dari Cloud Storage ke BigQuery.
Selanjutnya, Anda dapat menggunakan BigQuery untuk menganalisis varian.
Anda harus memahami skema varian BigQuery untuk mendapatkan informasi tentang cara alat memuat file VCF ke tabel BigQuery.