Herramienta Variant Transforms

Variant Transforms es una herramienta de código abierto usada con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.

Esta herramienta te permite transformar y cargar cientos de miles de archivos, millones de muestras y miles de millones de registros de forma escalable. Además, la herramienta tiene un preprocesador que puedes utilizar a fin de validar archivos VCF y para identificar inconsistencias.

El flujo de trabajo habitual en el uso de la herramienta consta de los siguientes pasos:

  1. Almacenar archivos VCF sin procesar en Cloud Storage
  2. Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.

Puedes utilizar BigQuery para analizar las variantes.

Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.