Cloud Data Fusion

可适应任何规模的全代管式云原生数据集成服务。

免费试用
  • action/check_circle_24px 使用 Sketch 创建。

    直观的点选式界面,可让您以无代码方式部署 ETL/ELT 数据流水线

  • action/check_circle_24px 使用 Sketch 创建。

    包含 150 多种预配置连接器和转换的大型插件库,无需额外费用

  • action/check_circle_24px 使用 Sketch 创建。

    原生集成的一流 Google Cloud 服务

  • action/check_circle_24px 使用 Sketch 创建。

    通过端到端数据世系分析根本原因和影响

  • action/check_circle_24px 使用 Sketch 创建。

    使用开源内核 (CDAP) 进行构建以实现流水线可移植性

消除技术瓶颈并提高生产力

Data Fusion 直观的拖放界面、预构建的连接器以及无代码自助式数据集成模型可消除专业知识方面的瓶颈,从而更快地获取数据洞见。

降低流水线总拥有成本

Data Fusion 是一种利用 Dataproc 等 Google 服务的可伸缩性和可靠性的无服务器方法,这意味着它能够提供最佳数据集成功能,同时具有更低的总拥有成本。

在数据治理基础上进行构建

Data Fusion 具有端到端数据世系、集成元数据以及云原生安全性和数据保护服务等内置功能,可以帮助团队进行根本原因或影响分析并满足合规性要求。

主要特性

开放式核心,可实现混合云和多云端集成

Data Fusion 使用开源项目 CDAP 进行构建,并且这一开放核心可为用户确保数据流水线的可移植性。CDAP 与本地系统和公有云平台进行了广泛的集成,这使得 Cloud Data Fusion 用户能够打破孤岛并发掘以前无法获取的数据洞见。

集成 Google 行业领先的大数据工具

Data Fusion 与 Google Cloud 的集成可简化数据安全并确保数据可立即用于分析。无论是使用 Cloud StorageDataproc 建立数据湖、将数据移到 BigQuery 以做数据仓储,还是转换数据以将其存放在某个关系型存储区(例如 Cloud Spanner)中,您都可以借助 Cloud Data Fusion 的集成,快速而轻松地进行开发和迭代。

通过协作和标准化进行数据集成

Cloud Data Fusion 提供了预构建的转换以及创建自定义连接和转换的内部库的功能,这些库能够在团队之间进行验证、共享和重用。Data Fusion 为协作式数据工程奠定了基础,并有助于提高工作效率。这意味着等待 ETL 开发者和数据工程师的时间大为减少,而且更重要的是,无需再为代码质量而担心。

查看所有特性

客户

Star Media Group 案例研究
Star Media Group 借助 Cloud Data Fusion 转型为互动型企业。
阅读案例

案例亮点

  • 技术驱动型变革带来的转型

  • 提供给消费者的个性化相关内容

  • 满足成本效益和可伸缩性要求

行业

文档

教程
启用 Cloud Data Fusion

了解如何为您的 Google Cloud 项目启用 Cloud Data Fusion API。

教程
Cloud Data Fusion 概念概览

了解 Cloud Data Fusion 的概念和功能。

教程
探索数据世系

本教程介绍如何使用 Cloud Data Fusion 来探索数据世系:数据的来源及其在一段时间内的移动。

教程
搭配使用 JDBC 驱动程序与 Cloud Data Fusion

了解如何将 Java Database Connectivity (JDBC) 驱动程序与 Cloud Data Fusion 流水线搭配使用。

教程
Google Cloud 上的数据工程

通过为期四天的讲师指导课程,直接了解如何在 Google Cloud 上设计和构建数据处理系统。

使用场景

使用场景
Google Cloud 上的现代化、更安全的数据湖

Cloud Data Fusion 通过集成来自孤立的本地平台的数据来帮助用户在 Google Cloud 上构建可伸缩的分布式数据湖。客户可以利用云的规模优势来集中处理数据,从而充分发掘数据价值。Cloud Data Fusion 的自助式功能可增强流程的可见性,并降低总体运营支持费用。

使用场景
BigQuery 的敏捷数据仓库

Cloud Data Fusion 可以打破数据孤岛,支持在 BigQuery 中开发基于云的敏捷数据仓库解决方案,从而帮助组织更好地了解其客户。通过以可靠且统一的方式查看客户互动情况及客户行为,您可以改善客户体验,进而提高客户留存率,并增加每位客户带来的平均收入。

使用场景
统一的分析环境

当今的许多用户都希望能够跨越数量众多、代价昂贵的本地数据集市,建立一个统一的分析环境。使用多种互不相关的工具和临时方案会造成数据质量和安全方面的问题。Cloud Data Fusion 的各种连接器、直观界面以及以业务逻辑为中心的抽象方式有助于降低总拥有成本、提升自助服务和标准化水平,并减少重复性工作。

所有特性

无代码自助服务 非技术型用户也可使用无代码的图形界面实现点选式数据集成,消除了这方面的瓶颈。
协作式数据工程 Cloud Data Fusion 让您能够创建由自定义连接和转换组成的内部库,以便在整个组织内部验证、共享和重用这些连接和转换。
Google Cloud 原生 全代管式 Google Cloud 原生架构可充分释放 Google Cloud 的可伸缩性、可靠性、安全性和隐私权功能。
企业级安全 Cloud Identity and Access Management (IAM)专用 IPVPC-SCCMEK 的集成可确保合规并保护数据,从而为企业提供安全保障并降低风险。
集成元数据和世系 根据技术元数据和业务元数据,在集成的数据集内进行搜索。在数据集和字段级层跟踪所有集成数据集的世系。
无缝运营 借助 REST API、基于时间的调度表、基于流水线状态的触发器、日志、指标和监控信息中心,您可以轻松地在任务关键型环境中开展运营。
全面的集成工具包 全面的数据集成体验:针对各种现代与传统系统的内置连接器、无代码转换、条件处理与预处理/后处理、提醒、通知以及错误处理。
适合混合环境 开源特性提供了必要的灵活性和可移植性,使您可以跨混合云和多云端环境构建标准化数据集成解决方案。

价格

Cloud Data Fusion 的价格按接口实例小时数和 Dataproc 虚拟机数细分。基本版提供每个帐号每月前 120 小时免费的优惠。

版本 每 Cloud Data Fusion 实例小时的价格 支持的并行流水线数量 支持的用户数
基本版 US$1.80 无限制 无限制
企业版 US$4.20 无限制 无限制