A Variant Transforms é uma ferramenta de código aberto usada com o Cloud Life Sciences. Ela é baseada no Apache Beam e usa o Dataflow.
Use a Variant Transforms para transformar e carregar de maneira escalonável os seguintes itens:
- Centenas de milhares de arquivos
- Milhões de amostras
- Bilhões de registros
Use o pré-processador da Variant Transforms para validar arquivos VCF e identificar inconsistências.
O fluxo de trabalho comum ao usar a ferramenta consiste nas seguintes etapas:
- Armazenar arquivos VCF brutos no Cloud Storage.
- Usar a ferramenta Variant Transforms para carregar os arquivos VCF do Cloud Storage para o BigQuery.
Você pode usar o BigQuery para analisar as variantes.
Conheça o esquema de variantes do BigQuery para saber como a ferramenta carrega arquivos VCF nas tabelas do BigQuery.