Cloud Data Fusion 价格

本文档介绍 Cloud Data Fusion 的价格。如需查看其他产品的价格,请参阅价格文档

计费时,用量按创建 Cloud Data Fusion 实例与删除该实例之间的时间长度(以分钟为单位)计算。虽然价格费率是按小时定义的,但 Cloud Data Fusion 的计费单位是分钟。结算时,系统会将用量折算为小时数(例如,30 分钟折算为 0.5 小时),以便对按分钟计算的用量应用小时定价。

如果您使用非美元货币付费,请参阅 Google Cloud SKU 上以您的币种列出的价格。

价格概览

Cloud Data Fusion 的价格拆分为以下两项功能的费用:流水线开发和流水线执行。

开发

对于流水线开发,Cloud Data Fusion 提供了以下三个版本:

Cloud Data Fusion 版本 价格/实例/小时
开发者版 $0.35(大约 $250/月)
基本版 $1.80(大约 $1100/月)
企业版 $4.20(大约 $3000/月)

基本版为每个账号提供每月前 120 小时免费的优惠。

执行

对于流水线执行,您需按当前 Dataproc 费率为 Dataproc 集群付费,这些集群由 Cloud Data Fusion 创建,用于运行流水线。

开发者版、基本版与企业版的比较

能力 开发者 基本 Enterprise
并发用户数 2 受限* 受限*
工作负载 开发、产品探索 测试、沙盒、POC 生产
内部 IP 支持
基于角色的访问权限控制 (RBAC)
可视化设计器
连接器生态系统
可视化转换
结构化、非结构化、半结构化
流处理流水线
集成沿袭 - 字段和数据集层级
与 Dataplex 集成
高可用性 可用区级 区域 区域
创建和自定义计算配置文件
DevOps 支持:REST API、源代码控制管理
触发器和时间表
执行环境选择
并发流水线执行 受限** 受限**
用于扩展功能的开发者 SDK

* 并发用户:通常,Cloud Data Fusion 支持每个实例最多 50 位用户。如果启用了 RBAC,则最多可有 25 位用户。

** 并发流水线执行有限,具体取决于正在使用的实例版本。如需了解可伸缩性的详细信息,请与 Google Cloud 代表联系。

使用其他 Google Cloud 资源

除了 Cloud Data Fusion 实例的开发费用之外,您只需为用于执行流水线的任何资源付费,例如:

支持的区域

目前,Cloud Data Fusion 在所有支持的区域价格相同。

区域 位置
africa-south1 * 南非约翰内斯堡
asia-east1 台湾彰化
asia-east2 香港
asia-northeast1 日本东京
asia-northeast2 日本大阪
asia-northeast3 韩国首尔
asia-south1 印度孟买
asia-south2 德里(印度)
asia-southeast1 新加坡裕廊西
asia-southeast2 雅加达(印度尼西亚)
australia-southeast1 澳大利亚悉尼
europe-north1 芬兰哈米纳
europe-southwest1 西班牙马德里
europe-west1 比利时圣吉斯兰
europe-west2 英国伦敦
europe-west3 德国法兰克福
europe-west4 荷兰埃姆斯哈文
europe-west6 瑞士苏黎世
europe-west8 意大利米兰
europe-west9 法国巴黎
europe-west12 * 意大利都灵
me-central1* 卡塔尔多哈
me-central2* 沙特阿拉伯达曼
me-west1 以色列特拉维夫
northamerica-northeast1 加拿大魁北克省蒙特利尔
southamerica-east1 巴西奥萨斯库(圣保罗)
southamerica-west1 智利圣地亚哥
us-central1 北美洲爱荷华州康瑟布拉夫斯
us-east1 北美洲南卡罗来纳州蒙克斯科纳
us-east4 北美洲北弗吉尼亚州阿什本
us-east5 北美洲俄亥俄州哥伦布
us-south1 北美洲德克萨斯州达拉斯
us-west1 北美洲俄勒冈州达尔斯
us-west2 北美洲加利福尼亚州洛杉矶

* africa-south1me-central1me-central1europe-west12 不支持 Cloud Data Fusion 中的数据沿袭

价格示例

假设某个 Cloud Data Fusion 实例已运行了 24 小时,并且基本版的免费小时数已用完。下表是各版本的 Cloud Data Fusion 实例费用汇总:

版本 费用/小时 小时数 开发费用
开发者版 $0.35 24 24*0.35 = 8.4 美元
基本 $1.80 24 24*1.8 = 43.2 美元
Enterprise $4.20 24 24*4.2 = 100.8 美元

在这 24 小时内,您每小时运行一条流水线,用于从 Cloud Storage 读取原始数据、执行转换以及将数据写入 BigQuery。每次运行大约需要 15 分钟。换句话说,为这些流水线运行而创建的 10 个 Dataproc 集群每个都持续存在了 15 分钟(0.25 小时)。假设每个 Dataproc 集群的配置如下:

资源项 机器类型 虚拟 CPU 数 挂接的永久性磁盘大小 在集群中的数量
主节点 n1-standard-4 4 500 GB 1
工作器节点 n1-standard-4 4 500 GB 5

每个 Dataproc 集群有 24 个虚拟 CPU:4 个用于主节点,20 个分散在工作器节点上。在计费时,Dataproc 会根据这 24 个虚拟 CPU 以及每个集群运行的时长确定此集群的价格。

就流水线的所有运行而言,Dataproc 产生的总费用可以按以下公式计算:

Dataproc charge = # of vCPUs * number of clusters * hours per cluster * Dataproc price
                      = 24 * 24 * 0.25 * $0.01
                      = $1.44

Dataproc 集群还会使用其他 Google Cloud 产品,相关的费用将另外结算。具体而言,这些集群将产生 Compute Engine 费用和标准永久性磁盘预配空间费用。您需承担 Cloud StorageBigQuery 的存储费用,具体取决于您的流水线处理的数据量。

如需根据当前费率确定这些额外费用,您可以使用结算计算器

后续步骤

申请定制报价

Google Cloud 采用随用随付的价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获取为贵组织量身定制的报价。
与销售人员联系