Strumento di trasformazione delle varianti

Trasformazioni delle varianti è uno strumento open source utilizzato con Cloud Life Sciences. Si basa su Apache Beam e utilizza Dataflow.

Puoi usare le trasformazioni delle varianti per trasformare e caricare quanto segue in modo scalabile:

  • Centinaia di migliaia di file
  • Milioni di esempi
  • Miliardi di record

Puoi utilizzare il pre-responsabile delle trasformazioni delle varianti per convalidare i file VCF e identificare le incoerenze.

Il flusso di lavoro tipico quando si utilizza lo strumento è costituito dai seguenti passaggi:

  1. Archiviazione di file VCF non elaborati in Cloud Storage.
  2. Usare lo strumento di trasformazione delle varianti per caricare i file VCF da Cloud Storage in BigQuery.

Puoi quindi utilizzare BigQuery per analizzare le varianti.

Dovresti acquisire familiarità con lo schema di varianti di BigQuery per informazioni su come lo strumento carica i file VCF nelle tabelle BigQuery.