Herramienta Variant Transforms

Variant Transforms es una herramienta de código abierto que se usa con Cloud Life Sciences. Se basa en Apache Beam y usa Dataflow.

Puedes usar Variant Transforms para transformar y cargar lo siguiente de manera escalable:

  • Cientos de miles de archivos
  • Millones de muestras
  • Miles de millones de registros

Puedes usar el procesador previo de Variant Transforms para validar archivos VCF y, además, identificar inconsistencias.

El flujo de trabajo típico cuando se usa la herramienta consiste en estos pasos:

  1. Almacenar archivos VCF sin procesar en Cloud Storage.
  2. Utilizar la herramienta Variant Transforms para cargar los archivos VCF de Cloud Storage a BigQuery.

Puedes utilizar BigQuery para analizar las variantes.

Deberías familiarizarte con el esquema de variantes de BigQuery a fin de obtener más información sobre cómo hace la herramienta para cargar archivos VCF en las tablas de BigQuery.