Ferramenta Variant Transforms

A Variant Transforms é uma ferramenta de código aberto usada com o Cloud Life Sciences. Ela é baseada no Apache Beam e usa o Dataflow.

Use a Variant Transforms para transformar e carregar de maneira escalonável os seguintes itens:

  • Centenas de milhares de arquivos
  • Milhões de amostras
  • Bilhões de registros

Use o pré-processador da Variant Transforms para validar arquivos VCF e identificar inconsistências.

O fluxo de trabalho comum ao usar a ferramenta consiste nas seguintes etapas:

  1. Armazenar arquivos VCF brutos no Cloud Storage.
  2. Usar a ferramenta Variant Transforms para carregar os arquivos VCF do Cloud Storage para o BigQuery.

Você pode usar o BigQuery para analisar as variantes.

Conheça o esquema de variantes do BigQuery para saber como a ferramenta carrega arquivos VCF nas tabelas do BigQuery.