Cloud Data Fusion测试版

可适应任何规模的全托管式无代码数据集成服务。

更智能的数据集成方式,可实现更智能的分析

Cloud Data Fusion 是一项全托管式云原生数据集成服务,可帮助用户高效地构建和管理 ETL/ELT 数据流水线。借助图形界面以及由预配置的连接器和转换组成的庞大开源库,Data Fusion 可让组织将工作重点放在获取洞见和采取行动上,而非代码和集成上。

无代码部署

以无代码方式部署数据流水线

Data Fusion 具有一个直观的点选式界面,可让您以无代码方式部署 ETL 流水线。通过结合使用庞大的数据转换蓝图库,Data Fusion 可为自助式数据集成模型提供支持,从而消除专业知识方面的瓶颈并让您更快地获取数据洞见。

开放式核心

开放式核心,可实现混合云和多云端集成

Data Fusion 在开源项目 CDAP 的基础上构建而成。这一开放式核心可为用户确保数据流水线的可移植性。CDAP 与本地系统和公有云平台进行了广泛的集成,这使得 Data Fusion 用户能够打破孤岛并发掘以前无法获取的数据洞见。

领先的大数据工具

更充分地利用 Google 行业领先的大数据工具

Data Fusion 与 Google Cloud 的原生集成可简化数据安全并确保数据可立即用于分析。无论是通过 Cloud Storage 和 Cloud Dataproc 建立数据湖、将数据移到 BigQuery 数据仓库中,还是转换数据以将其存放在某个关系型存储区(例如 Cloud Spanner)中,您都可以借助 Data Fusion 的集成,快速而轻松地进行开发和迭代。

可靠的数据工程

通过协作和标准化,实现可靠的数据工程

Data Fusion 不但提供来自 OSS 库的预配置转换,还让您能够创建由自定义连接和转换组成的内部库,以便在整个组织内部验证、共享和重用这些连接和转换。Data Fusion 为协作式数据工程奠定了基础,并有助于提高工作效率。这意味着几乎不用再为等待数据工程师而浪费时间,更重要的是,无需再为代码质量而劳心费神。

特性

无代码自助服务

消除了技术方面的瓶颈,用户即使不具备相关技术,也可通过无代码图形界面实现点选式数据集成。

协作式数据工程

借助 Data Fusion,您可以创建由自定义连接和转换组成的内部库,以便在整个组织内部验证、共享和重用这些连接和转换。

GCP 原生

全托管式 GCP 原生架构可充分释放 Google Cloud 的可扩缩性、可靠性、安全性和隐私保护潜能。

企业级安全保障

与 Cloud Identity and Access Management (IAM) 和 Cloud Identity-Aware Proxy (IAP) 的集成可确保合规并保护数据,从而为企业提供安全保障并降低风险。

集成元数据和沿袭

根据技术元数据和业务元数据,在集成的数据集内进行搜索。在数据集和字段级别跟踪所有集成数据集的沿袭。

无缝运营

借助 REST API、基于时间的调度表、基于流水线状态的触发器、日志、指标和监控信息中心,您可以轻松地在任务关键型环境中开展运营。

全面的集成工具包

多种功能为您带来全面的数据集成体验:面向各种新式系统与旧式系统的内置连接器、无代码转换、按条件处理、预处理/后处理、提醒、通知以及错误处理。

适合混合环境

开源特性带来了必要的灵活性和可移植性,使您可以跨混合云和多云环境构建标准化数据集成解决方案。

行业使用场景

更安全的云端数据湖

更安全的新式云端数据湖

Cloud Data Fusion 可帮助用户将数据从孤立的本地平台迁移到云端,进而在 GCP 上构建可扩缩的分布式数据湖。客户可以利用云的规模优势来集中处理数据,从而充分发掘数据价值。Cloud Data Fusion 的自助式功能可增强流程的可见性,并降低总体运营支持费用。

统一的分析环境

统一的分析环境

如今,许多用户都希望跨众多昂贵的本地数据集市建立一个统一的分析环境。如果使用多种互不相关的工具和临时方案来整合这些不同来源的数据,可能会造成数据质量问题和安全问题。Cloud Data Fusion 的各种连接器、直观界面以及以业务逻辑为中心的抽象方式有助于降低总拥有成本、提升自助服务和标准化水平,并减少重复性工作。

全面了解客户

全面了解客户

Cloud Data Fusion 可以打破数据孤岛(包括传统的线上和线下客户信息孤岛),从而帮助组织更好地了解其客户。通过以可靠且统一的方式查看客户互动情况及客户行为,您可以改善客户体验,进而提高客户留存率,并增加每位客户带来的平均收入。

价格

服务价格分为以下两个部分:

  • 用于操作数据集成界面的 Cloud Data Fusion 实例小时数
  • 用于执行 Cloud Data Fusion 所规定转换的 Cloud Dataproc 虚拟机数
版本 每 Cloud Data Fusion 实例小时的价格 支持的并行流水线数量 支持的用户数
基本版 $1.80 2 无限制
企业版 $4.20 无限制 无限制

Data Fusion 提供了直观的图形界面和流水线抽象机制,从而降低了处理大数据的入门门槛。除了门槛降低之外,由预建的“连接器”和“转换”组成的库也在不断扩充,这使得我们可以快速获得所需结果,并且在许多情况下可让数据分析师和数据科学家“自助”操作,而无需具备深厚云技术或软件工程专业知识的人员提供帮助。

Robert Medeiros,TELUS Digital 研发架构师

资源

Google Cloud

开始使用

学习和构建

刚接触 GCP?您可以领取 $300 赠金,免费开始使用任意 GCP 产品。

需要更多帮助?

我们的专家会根据您的需求,帮您打造合适的解决方案,或帮您寻找合适的合作伙伴。

发送以下问题的反馈:

此网页
Cloud Data Fusion