可适应任何规模的全代管式云原生数据集成服务。
新客户可获得 $300 赠金,用于抵扣在 Data Fusion 上的支出。所有客户每个帐号每月前 120 小时的流水线开发费用全免,不计入赠金额度。
优势
Data Fusion 直观的拖放界面、预构建的连接器以及无代码自助式数据集成模型可消除专业知识方面的瓶颈,从而更快地获取数据洞见。
Data Fusion 是一种利用 Dataproc 等 Google 服务的可伸缩性和可靠性的无服务器方法,这意味着它能够提供最佳数据集成功能,同时具有更低的总拥有成本。
Data Fusion 具有端到端数据世系、集成元数据以及云原生安全性和数据保护服务等内置功能,可以帮助团队进行根本原因或影响分析并满足合规性要求。
主要特性
Data Fusion 使用开源项目 CDAP 进行构建,并且这一开放核心可为用户确保数据流水线的可移植性。CDAP 与本地系统和公有云平台进行了广泛的集成,这使得 Cloud Data Fusion 用户能够打破孤岛并发掘以前无法获取的数据洞见。
Data Fusion 与 Google Cloud 的集成可简化数据安全并确保数据可立即用于分析。无论是使用 Cloud Storage 和 Dataproc 建立数据湖、将数据转移到 BigQuery 用于数据仓储,还是转换数据以将其存放在某个关系型存储区(例如 Cloud Spanner)中,您都可以借助 Cloud Data Fusion 的集成,快速而轻松地进行开发和迭代。
Cloud Data Fusion 为批处理和实时处理提供了预构建的转换。借助 Cloud Data Fusion,您可以创建自定义连接和转换的内部库,从而在各个团队中验证、共享和重用这些连接和转换。Data Fusion 为协作式数据工程奠定了基础,并有助于提高工作效率。这意味着等待 ETL 开发者和数据工程师的时间大为减少,而且重要的是,无需再为代码质量而担心。
最新资讯
订阅 Google Cloud 简报,了解产品动态、活动安排、特别优惠以及更多资讯。
文档
使用场景
Cloud Data Fusion 集成来自孤立的本地平台的数据,帮助用户在 Google Cloud 上构建可伸缩的分布式数据湖。客户可以利用云的规模优势来集中处理数据,从而充分发掘数据价值。Cloud Data Fusion 的自助式功能可增强流程的可见性,并降低总体运营支持费用。
Cloud Data Fusion 可以打破数据孤岛,支持在 BigQuery 中开发基于云的敏捷数据仓库解决方案,从而帮助组织更好地了解其客户。通过以可靠且统一的方式查看客户互动情况及客户行为,您可以改善客户体验,进而提高客户留存率,并增加每位客户带来的平均收入。
当今的许多用户都希望能够建立一个统一的分析环境,涵盖众多昂贵的本地数据集市。使用多种互不相关的工具和临时方案会造成数据质量和安全方面的问题。Cloud Data Fusion 的各种连接器、直观界面以及以业务逻辑为中心的抽象方式有助于降低总拥有成本、提升自助服务和标准化水平,并减少重复性工作。
所有特性
无代码自助服务 | 非技术型用户也可使用无代码的图形界面实现点选式数据集成,消除了这方面的瓶颈。 |
协作式数据工程 | Cloud Data Fusion 让您能够创建由自定义连接和转换组成的内部库,以便在整个组织内部验证、共享和重用这些连接和转换。 |
Google Cloud 原生 | 全代管式 Google Cloud 原生架构可充分释放 Google Cloud 的可伸缩性、可靠性、安全性和隐私权功能。 |
实时数据集成 | 使用 Data Fusion 的复制功能,只需点击几下即可直接将 SQL Server、Oracle 和 MySQL 等事务型和操作型数据库复制到 BigQuery。与 Datastream 的集成使您可以将变化数据流传输到 BigQuery 以进行持续分析。利用可行性评估实现更快的开发迭代,利用性能/健康状况监控实现可观测性。 |
批量集成 | 凭借对常见数据源(包括文件系统和对象存储、关系型和 NoSQL 数据库、SaaS 系统和主机)的支持,设计、运行和定期运维大量数据流水线。 |
企业级安全 | 与 Cloud Identity and Access Management (IAM)、专用 IP、VPC-SC 和 CMEK 的集成可确保合规并保护数据,从而为企业提供安全保障,降低风险。 |
集成元数据和世系 | 根据技术元数据和业务元数据,在集成的数据集内进行搜索。在数据集和字段级层跟踪所有集成数据集的世系。 |
无缝运营 | 借助 REST API、基于时间的调度表、基于流水线状态的触发器、日志、指标和监控信息中心,您可以轻松地在任务关键型环境中开展运营。 |
全面的集成工具包 | 全面的数据集成体验:针对各种现代与传统系统的内置连接器、无代码转换、条件处理与预处理/后处理、提醒、通知以及错误处理。 |
适合混合环境 | 开源特性提供了必要的灵活性和可移植性,使您可以跨混合云和多云环境构建标准化数据集成解决方案。 |
价格
Cloud Data Fusion 价格细分为以下部分:
1. 设计费用:基于实例运行的小时数,而不是正在开发和运行的流水线数量。基本版提供每个账号每月前 120 小时免费的优惠。
2. 处理费用:用于运行流水线的 Dataproc 集群的费用。
版本 | 每 Cloud Data Fusion 实例小时的价格 | 支持的并行流水线数量 | 支持的用户数 |
---|---|---|---|
开发者 | US$0.35 | 2(推荐) | 2(推荐) |
基本 | US$1.80 | 无限制 | 无限制 |
Enterprise | US$4.20 | 无限制 | 无限制 |