Regardez le Data Cloud Summit à la demande et découvrez les dernières innovations concernant l'analyse, l'IA, l'informatique décisionnelle et les bases de données.
Intégration de données cloud native et entièrement gérée à n'importe quelle échelle.
Les nouveaux clients bénéficient de 300 $ de crédits à dépenser sur Data Fusion. Tous les clients bénéficient sans frais des 120 premières heures de développement du pipeline par mois et par compte.
Interface graphique de type "pointer-cliquer" permettant de déployer des pipelines de données ETL/ELT sans code
Vaste bibliothèque de plus de 150 transformations et connecteurs préconfigurés, disponible sans frais supplémentaires
Services Google Cloud de pointe intégrés de manière native
Traçage de données de bout en bout pour l'analyse des causes fondamentales et de l'impact
Créé avec un noyau Open Source (CDAP) pour permettre la portabilité des pipelines
Avantages
Éviter les goulots d'étranglement techniques et augmenter la productivité
Avec son interface intuitive de type "glisser-déposer", ses connecteurs pré-intégrés et son modèle en libre-service d'intégration de données sans code, Data Fusion élimine les goulots d'étranglement liés aux expertises techniques, et accélère l'obtention d'insights.
Réduire le coût total de possession de pipelines
Une approche sans serveur exploitant l'évolutivité et la fiabilité des services Google comme Managed Service for Apache Spark permet à Data Fusion d'offrir le meilleur des capacités d'intégration de données à un coût total de possession réduit.
Créer en vous appuyant sur la gouvernance des données
Grâce à des fonctionnalités intégrées telles que la traçabilité des données de bout en bout, les métadonnées d'intégration et les services de sécurité et de protection des données cloud natives, Data Fusion aide les équipes à analyser les causes fondamentales ou l'impact, et à respecter les exigences en matière de conformité.
Principales fonctionnalités
Data Fusion est construit autour du projet Open Source CDAP, et ce noyau ouvert assure aux utilisateurs la portabilité de leurs pipelines de données. L'intégration étendue de CDAP aux plates-formes sur site et cloud public permet aux utilisateurs de Cloud Data Fusion de décloisonner les données et d'accéder à des insights inaccessibles jusque-là.
L'intégration de Data Fusion avec Google Cloud simplifie la sécurité des données et garantit que les données sont immédiatement disponibles pour l'analyse. Que vous gériez un lac de données avec Cloud Storage et Managed Service pour Apache Spark, transfériez des données dans BigQuery pour les y entreposer, ou les transformiez pour les stocker dans un store relationnel tel que Spanner, l'intégration de Cloud Data Fusion facilite et accélère le développement et l'itération.
Cloud Data Fusion offre des transformations prédéfinies pour le traitement par lot et en temps réel. Il permet de créer une bibliothèque interne de connexions et de transformations personnalisées pouvant être validées, partagées et réutilisées entre les équipes. Il établit des fondations solides pour une ingénierie collaborative des données et améliore la productivité. Ainsi, les développeurs ETL bénéficient de temps d'attente réduits et, tout aussi important, peuvent être rassurés sur la qualité du code.
Clients
Nouveautés
Inscrivez-vous à la newsletter Google Cloud pour recevoir des informations sur les produits et événements, des offres spéciales et bien plus encore.
Documentation
Cas d'utilisation
Cloud Data Fusion aide les utilisateurs à créer des lacs de données évolutifs et distribués sur Google Cloud en intégrant des données provenant de plates-formes cloisonnées sur site. Les clients peuvent profiter de l'échelle du cloud pour centraliser leurs données et en dégager ainsi davantage de valeur. Les capacités de libre-service de Cloud Data Fusion augmentent la visibilité sur les processus et réduisent le coût global des opérations.
Cloud Data Fusion peut aider les entreprises à mieux comprendre leurs clients en décloisonnant les données et en permettant le développement de solutions agiles d'entreposage de données basées sur le cloud dans BigQuery. Une vue unifiée et fiable de l'engagement et du comportement des clients ouvre des portes pour améliorer l'expérience client, ce qui permet d'accroître la rétention et les revenus associés à chaque client.
Aujourd'hui, de nombreux utilisateurs souhaitent établir un environnement d'analyse unifié pour fédérer une multitude coûteuse de centres de données sur site. Utiliser un éventail disparate d'outils déconnectés et de solutions provisoires pose de véritables problèmes en termes de qualité et de sécurité des données. La gamme étendue de connecteurs, d'interfaces visuelles et d'abstractions basées sur la logique métier proposée par Cloud Data Fusion permet de réduire le coût total de possession, de promouvoir le libre-service et la standardisation, ainsi que de réduire les tâches répétitives.
Toutes les fonctionnalités
| Libre-service sans code | Supprimez les goulots d'étranglement en permettant aux utilisateurs de domaines non techniques de travailler grâce à une interface graphique sans code, qui offre une intégration de données suivant le principe de "pointer-cliquer". |
| Ingénierie de données collaborative | Cloud Data Fusion offre la possibilité de créer une bibliothèque interne de connexions et transformations personnalisées pouvant être validées, partagées et réutilisées au sein d'une organisation. |
| Google Cloud natif | L'architecture native Google Cloud entièrement gérée permet aux clients de bénéficier des fonctionnalités d'évolutivité, de fiabilité, de sécurité et de confidentialité de Google Cloud. |
| Intégration des données en temps réel | Répliquez des bases de données transactionnelles et opérationnelles telles que SQL Server, Oracle et MySQL directement dans BigQuery en quelques clics à l'aide de la fonctionnalité de réplication de Data Fusion. L'intégration à Datastream vous permet de transmettre des flux de modifications dans BigQuery pour des analyses continues. Utilisez l'évaluation de faisabilité pour des itérations de développement plus rapides et une surveillance des performances/de l'état pour l'observabilité. |
| Intégration par lot | Concevez, exécutez et exploitez régulièrement de grands volumes de pipelines de données, compatibles avec des sources de données répandues comme les systèmes de fichiers, les stores d'objets, les systèmes SaaS, les bases de données relationnelles et NoSQL, ainsi que les mainframes. |
| Une sécurité de niveau professionnel | L'intégration avec Cloud Identity and Access Management (IAM), Private IP, VPC-SC et CMEK offre une sécurité de niveau entreprise et réduit les risques en assurant la conformité et la protection des données. |
| Métadonnées d'intégration et traçabilité | Effectuez des recherches au sein des ensembles de données intégrés sur la base de métadonnées techniques et métier. Assurez la traçabilité de tous les ensembles de données intégrés au niveau de l'ensemble de données et au niveau des champs. |
| Des opérations d'une fluidité parfaite | Les déclencheurs, journaux, métriques et tableaux de bord de surveillance basés sur l'état du pipeline, ainsi que les API REST et les planifications temporelles facilitent son utilisation dans les environnements critiques. |
| Une boîte à outils d'intégration complète | Les connecteurs intégrés dans un éventail de systèmes aussi bien modernes qu'anciens, les transformations sans code, les conditions et le pré/post-traitement, les alertes et notifications ainsi que le traitement des erreurs assurent une expérience exhaustive de l'intégration des données. |
| Prêt pour une utilisation hybride | L'Open Source offre la flexibilité et la portabilité requises pour créer des solutions d'intégration de données standardisées dans des environnements hybrides et multicloud. |
Tarification
La tarification de Cloud Data Fusion est basée sur les éléments suivants :
1. Coût de conception : basé sur le nombre d'heures d'exécution d'une instance, et non sur le nombre de pipelines développés et exécutés. L'édition Basic offre les 120 premières heures par mois et par compte, sans frais.
2. Coût de traitement : coût des clusters Managed Service pour Apache Spark utilisés pour exécuter les pipelines.
Édition | Prix par instance-heure Cloud Data Fusion | Nombre de pipelines simultanés acceptés | Nombre d'utilisateurs acceptés |
|---|---|---|---|
Développeur | 0,35 US$ | 2 (recommandé) | 2 (recommandé) |
Basic | 1,80 US$ | Illimité | Illimité |
Enterprise | 4,20 US$ | Illimité | Illimité |
Commencez à créer sur Google Cloud avec 300 $ de crédits inclus et plus de 20 produits toujours sans frais.