价格

本文档介绍 Cloud Data Fusion 的价格。如需查看其他产品的价格,请参阅价格文档

计费时,用量按创建 Cloud Data Fusion 实例与删除该实例之间的时间长度(以分钟为单位)计算。虽然价格费率是按小时定义的,但 Cloud Data Fusion 的计费单位是分钟。结算时,系统会将用量折算为小时数(例如,30 分钟折算为 0.5 小时),以便对按分钟计算的用量应用小时定价。

如果您使用非美元货币付费,请参阅 Google Cloud SKU 上以您的币种列出的价格。

价格概览

Cloud Data Fusion 的价格拆分为以下两项功能的费用:流水线开发和流水线执行。

开发

对于流水线开发,Cloud Data Fusion 提供了以下三个版本:

Cloud Data Fusion 版本 价格/实例/小时
开发者版 $0.35(大约 $250/月)
基本版 $1.80(大约 $1100/月)
企业版 $4.20(大约 $3000/月)

基本版为每个帐号提供每月前 120 小时免费的优惠。

执行

对于流水线执行,您需按当前 Dataproc 费率为 Dataproc 集群付费,这些集群由 Cloud Data Fusion 创建,用于运行流水线。

开发者版、基本版与企业版的比较

功能 开发者版 基本版 企业版
用户数量 2(推荐)* 无限制 无限制
工作负载 开发、产品探索 测试、沙盒、PoC 生产
可视化设计器
连接器生态系统
可视化转换
用于扩展功能的开发者 SDK
数据质量和清理库
专用 IP 支持
调试和测试(编程方式与可视方式)
联接、融合、聚合转换
结构化、非结构化、半结构化
流处理流水线
集成元数据代码库
集成沿袭 - 字段和数据集层级
高可用性 可用区 区域
(容量较低)
区域
(容量较高)
运行时 临时 1 工作器 Dataproc 临时 2 工作器 Dataproc 临时和专用 Dataproc、Hadoop、EMR
DevOps 支持 - REST API
触发器/时间表
执行环境选择

* 开发者版本提供 Cloud Data Fusion 的全套功能,但可靠性和可扩缩性保证有限。如果多人同时使用,性能可能会下降。

使用其他 Google Cloud 资源

除了 Cloud Data Fusion 实例的开发费用之外,您只需为用于执行流水线的资源付费,例如:

支持的区域

目前,Cloud Data Fusion 在所有支持的区域价格相同。

区域 位置
asia-east1 台湾彰化
asia-east2 香港
asia-northeast1 日本东京
asia-northeast2 日本大阪
asia-northeast3 韩国首尔
asia-south1 印度孟买
asia-southeast1 新加坡裕廊西
australia-southeast1 澳大利亚悉尼
europe-north1 芬兰哈米纳
europe-west1 比利时圣吉斯兰
europe-west2 英国伦敦
europe-west3 德国法兰克福
europe-west4 荷兰埃姆斯哈文
europe-west6 瑞士苏黎世
northamerica-northeast1 加拿大魁北克省蒙特利尔
southamerica-east1 巴西奥萨斯库(圣保罗)
us-central1 美国爱荷华州康瑟布拉夫斯
us-east1 美国南卡罗来纳州蒙克斯科纳
us-east4 美国北弗吉尼亚州阿什本
us-west1 美国俄勒冈州达尔斯
us-west2 美国加利福尼亚州洛杉矶

价格示例

假设某个 Cloud Data Fusion 实例已运行了 10 小时,并且基本版的免费小时数已用完。下表是各版本的 Cloud Data Fusion 开发费用汇总:

版本 费用/小时 小时数 开发费用
开发者版 $0.35 10 10 * 0.35 = $3.50
基本版 $1.80 10 10 * 1.8 = $18
企业版 $4.20 10 10 * 4.2 = $42

在这 10 小时内,您每个小时都运行一条流水线,用于从 Cloud Storage 读取原始数据、执行转换以及向 BigQuery 写入数据。每次运行大约需要 15 分钟。换句话说,为这些流水线运行而创建的 10 个 Dataproc 集群每个都持续存在了 15 分钟(0.25 小时)。假设每个 Dataproc 集群的配置如下:

资源项 机器类型 虚拟 CPU 数 挂接的永久性磁盘大小 在集群中的数量
主节点 n1-standard-4 4 500 GB 1
工作器节点 n1-standard-4 4 500 GB 5

每个 Dataproc 集群有 24 个虚拟 CPU:4 个用于主节点,20 个分散在工作器节点上。在计费时,Dataproc 会根据这 24 个虚拟 CPU 以及每个集群运行的时长确定此集群的价格。

就流水线的所有运行而言,Dataproc 产生的总费用可以按以下公式计算:

Dataproc charge = # of vCPUs * number of clusters * hours per cluster * Dataproc price
                      = 24 * 10 * 0.25 * $0.01
                      = $0.60

Dataproc 集群还会使用其他 Google Cloud 产品,相关的费用将另外结算。具体而言,这些集群将产生 Compute Engine 费用和标准永久性磁盘预配空间费用。您需承担 Cloud StorageBigQuery 的存储费用,具体取决于您的流水线处理的数据量。

如需根据当前费率确定这些额外费用,您可以使用结算计算器