Variant Transforms es una herramienta de código abierto que se usa con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.
Puede utilizar Variant Transforms para transformar y cargar lo siguiente de manera escalable:
- Cientos de miles de archivos
- Millones de muestras
- Miles de millones de registros
Puedes utilizar el preprocesador de Variant Transforms para validar archivos VCF y, además, identificar inconsistencias.
El flujo de trabajo típico cuando se utiliza la herramienta consta de los siguientes pasos:
- Almacenar archivos VCF sin procesar en Cloud Storage.
- Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.
Puedes utilizar BigQuery para analizar las variantes.
Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.