Développez et opérationnalisez des pipelines de transformation de données évolutifs dans BigQuery à l'aide du langage SQL.
Développez des tables sélectionnées, documentées, fiables et à jour dans BigQuery
Permettez aux analystes et aux ingénieurs de données de collaborer sur le même dépôt
Créez des pipelines de données évolutifs dans BigQuery à l'aide du langage SQL
Intégrez l'outil à GitHub et GitLab
Maintenez les tables à jour sans avoir à gérer l'infrastructure
Avantages
Développez et opérationnalisez des pipelines de transformation de données évolutifs dans BigQuery à l'aide du langage SQL, à partir d'un environnement unique et sans dépendances supplémentaires.
Avec Dataform, les équipes responsables des données gèrent le code SQL et les définitions des éléments de données conformément aux bonnes pratiques d'ingénierie logicielle, telles que le contrôle des versions, les environnements, les tests et la documentation.
Dataform élimine la complexité liée à la création de pipelines SQL. Les analystes de données peuvent gérer les dépendances, configurer des tests de qualité des données et orchestrer des pipelines complexes à l'aide de SQL.
Principales fonctionnalités
Dataform Core permet aux ingénieurs et aux analystes de données de créer des définitions de table, de configurer des dépendances, d'ajouter des descriptions de colonnes et de configurer des assertions de qualité des données de manière centralisée dans un dépôt unique simplement à l'aide du langage SQL.
Les fonctionnalités de Dataform Core peuvent être adoptées progressivement et de façon complémentaire, sans modifier le code existant.
Dataform Core est un langage Open Source pouvant être utilisé localement. Les utilisateurs n'ont pas besoin de dépendre d'un fournisseur et bénéficient de plus de flexibilité pour les cas d'utilisation plus avancés.
Dataform gère l'infrastructure opérationnelle pour mettre à jour vos tables en suivant les dépendances entre vos tables et en utilisant la dernière version de votre code. Vous pouvez suivre facilement les informations de traçabilité et de données grâce aux intégrations Dataform. Déclenchez des workflows SQL manuellement, ou planifiez-les via Cloud Composer, Workflows ou des services tiers.
Définissez des tables, corrigez les problèmes liés aux messages d'erreur en temps réel, visualisez les dépendances, validez les modifications dans Git et planifiez les pipelines en quelques minutes à partir d'une seule interface, sans quitter votre navigateur Web. Connectez votre dépôt à des fournisseurs tiers tels que GitHub et GitLab. Validez les modifications et envoyez ou ouvrez des demandes d'extraction depuis l'IDE.
Documentation
Tarification
Dataform est un service gratuit.
Son utilisation peut entraîner des coûts associés à d'autres services.
Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.