Variant Transforms es una herramienta de código abierto usada con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.
Esta herramienta te permite transformar y cargar cientos de miles de archivos, millones de muestras y miles de millones de registros de forma escalable. Además, la herramienta tiene un preprocesador que puedes utilizar a fin de validar archivos VCF y para identificar inconsistencias.
El flujo de trabajo habitual en el uso de la herramienta consta de los siguientes pasos:
- Almacenar archivos VCF sin procesar en Cloud Storage
- Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.
Puedes utilizar BigQuery para analizar las variantes.
Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.