Herramienta Variant Transforms

Variant Transforms es una herramienta de código abierto usada con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.

Puedes usar Variant Transforms para transformar y cargar lo siguiente de manera escalable:

  • Cientos de miles de archivos
  • Millones de muestras
  • Miles de millones de registros

Puedes usar el preprocesador para validar archivos VCF y para identificar inconsistencias.

El flujo de trabajo típico cuando se utiliza la herramienta consta de los siguientes pasos:

  1. Almacenar archivos VCF sin procesar en Cloud Storage
  2. Utiliza la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage en BigQuery.

Puedes utilizar BigQuery para analizar las variantes.

Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.