Herramienta Variant Transforms

Variant Transforms es una herramienta de código abierto que se usa con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.

Puedes usar Variant Transforms para transformar y cargar lo siguiente de forma escalable:

  • Cientos de miles de archivos
  • Millones de muestras
  • Miles de millones de registros

Puedes usar el preprocesador Variant Transforms para validar archivos VCF y para identificar inconsistencias.

El flujo de trabajo típico cuando se usa la herramienta consta de los siguientes pasos:

  1. Almacenar archivos VCF sin procesar en Cloud Storage.
  2. Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.

Puedes utilizar BigQuery para analizar las variantes.

Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.