Variant Transforms est un outil Open Source compatible avec Cloud Life Sciences. Il est basé sur Apache Beam et utilise Dataflow.
Vous pouvez utiliser Variant Transforms pour transformer et charger les éléments suivants de manière évolutive :
- Des centaines de milliers de fichiers
- Des millions d'échantillons
- Des milliards d'enregistrements
Vous pouvez utiliser le préprocesseur Variant Transforms pour valider les fichiers VCF et identifier les incohérences.
Pour utiliser l'outil, le workflow typique comprend les étapes suivantes :
- Stockage de fichiers VCF bruts dans Cloud Storage
- Utilisation de l'outil Variant Transforms pour charger les fichiers VCF de Cloud Storage dans BigQuery
Vous pouvez ensuite analyser les variantes à l'aide de BigQuery.
Familiarisez-vous avec le schéma de variantes BigQuery pour savoir comment l'outil charge les fichiers VCF dans les tables BigQuery.