Outil Variant Transforms

Variant Transforms est un outil Open Source compatible avec Cloud Life Sciences. Il est basé sur Apache Beam et utilise Dataflow.

Vous pouvez utiliser Variant Transforms pour transformer et charger les éléments suivants de manière évolutive:

  • Des centaines de milliers de fichiers
  • Des millions d'échantillons
  • Des milliards d'enregistrements

Vous pouvez utiliser le préprocesseur de Variant Transforms pour valider les fichiers VCF et identifier les incohérences.

Pour exécuter l'outil, le workflow typique comprend les étapes suivantes:

  1. Stockage des fichiers VCF bruts dans Cloud Storage
  2. Utiliser l'outil Variant Transforms pour charger les fichiers VCF depuis Cloud Storage dans BigQuery

Vous pouvez ensuite analyser les variantes à l'aide de BigQuery.

Familiarisez-vous avec le schéma de variantes BigQuery pour savoir comment l'outil charge les fichiers VCF dans les tables BigQuery.