Variant Transforms es una herramienta de código abierto que se usa con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.
Puedes usar Variant Transforms para transformar y cargar lo siguiente de forma escalable:
- Cientos de miles de archivos
- Millones de muestras
- Miles de millones de registros
Puedes usar el preprocesador Variant Transforms para validar archivos VCF y para identificar inconsistencias.
El flujo de trabajo típico cuando se usa la herramienta consta de los siguientes pasos:
- Almacenar archivos VCF sin procesar en Cloud Storage.
- Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.
Puedes utilizar BigQuery para analizar las variantes.
Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.