本文档介绍 Cloud Data Fusion 的价格。如需查看其他产品的价格,请参阅价格文档。
计费时,用量按从创建 Cloud Data Fusion 实例到删除该实例的时间长度(以分钟为单位)计算。虽然价格费率是按小时定义的,但 Cloud Data Fusion 的计费单位是分钟。结算时,系统会将用量折算为小时数(例如,30 分钟折算为 0.5 小时),以便对按分钟计算的用量应用小时定价。
如果您使用非美元货币付费,请参阅 Google Cloud SKU 上以您的币种列出的价格。
Cloud Data Fusion 的价格拆分为以下两项功能的费用:流水线开发和流水线执行。
开发
对于流水线开发,Cloud Data Fusion 提供了以下三个版本:
Cloud Data Fusion 版本 | 价格(美元) |
|---|---|
开发者 | US$0.35 / 1 hour |
基本 | 0 hour to 120 hour Free per 1 month / account 120 hour and above US$1.80 / 1 hour, per 1 month / account |
企业 | US$4.20 / 1 hour |
基本版为每个账号提供每月前 120 小时免费的优惠。
执行
对于流水线执行,您需按当前 Managed Service for Apache Spark 费率为 Managed Service for Apache Spark 集群付费,这些集群由 Cloud Data Fusion 创建,用于运行流水线。
能力 | 开发者 | 基本 | 企业 |
|---|---|---|---|
并发用户数 | 2 | 受限* | 受限* |
工作负载 | 开发、产品探索 | 测试、沙盒、PoC | 生产环境 |
内部 IP 支持 | ✓ | ✓ | ✓ |
基于角色的访问权限控制 (RBAC) | 🚫 | 🚫 | ✓ |
可视化设计器 | ✓ | ✓ | ✓ |
连接器生态系统 | ✓ | ✓ | ✓ |
可视化转换 | ✓ | ✓ | ✓ |
结构化、非结构化、半结构化 | ✓ | ✓ | ✓ |
流处理流水线 | ✓ | ✓ | ✓ |
集成沿袭 - 字段和数据集层级 | ✓ | ✓ | ✓ |
与 Knowledge Catalog 集成 | ✓ | ✓ | ✓ |
高可用性 | 可用区级 | 区域 | 区域 |
创建和自定义计算配置文件 | ✓ | ✓ | ✓ |
DevOps 支持:REST API、源代码控制管理 | ✓ | ✓ | ✓ |
触发器和时间表 | ✓ | ✓ | ✓ |
执行环境选择 | ✓ | ✓ | ✓ |
并发流水线执行 | 🚫 | 受限** | 受限** |
用于扩展功能的开发者 SDK | ✓ | ✓ | ✓ |
* 并发用户:通常,Cloud Data Fusion 每个实例最多支持 50 个用户。如果启用了 RBAC,则最多支持 25 个用户。
** 并发流水线执行受到限制,具体取决于所使用的实例版本。如需了解扩缩详情,请与 Google Cloud 代表联系。
除了 Cloud Data Fusion 实例的开发费用之外,您只需为用于执行流水线的资源付费,例如:
★ 对于构建复制作业,建议采用 BigQuery 固定费率价格 ,不采用按需价格。
目前,所有支持的区域的 Cloud Data Fusion 价格都相同。
地区 | 位置 |
|---|---|
africa-south1 * | 南非约翰内斯堡 |
asia-east1 | 台湾彰化 |
asia-east2 | 中国香港 |
asia-northeast1 | 日本东京 |
asia-northeast2 | 日本大阪 |
asia-northeast3 | 韩国首尔 |
asia-south1 | 印度孟买 |
asia-south2 | 德里(印度) |
asia-southeast1 | 新加坡裕廊西 |
asia-southeast2 | 印度尼西亚雅加达 |
australia-southeast1 | 澳大利亚悉尼 |
europe-north1 | 芬兰哈米纳 |
europe-southwest1 | 西班牙马德里 |
europe-west1 | 比利时圣吉斯兰 |
europe-west2 | 英国伦敦 |
europe-west3 | 德国法兰克福 |
europe-west4 | 荷兰埃姆斯哈文 |
europe-west6 | 瑞士苏黎世 |
europe-west8 | 意大利米兰 |
europe-west9 | 法国巴黎 |
europe-west12* | 意大利都灵 |
me-central1* | 卡塔尔多哈 |
me-central2* | 沙特阿拉伯达曼 |
me_west1 | 以色列特拉维夫 |
northamerica-northeast1 | 加拿大魁北克省蒙特利尔 |
northamerica-south1 | 墨西哥 |
southamerica-east1 | 巴西奥萨斯库(圣保罗) |
southamerica-west1 | 智利圣地亚哥 |
us-central1 | 北美洲爱荷华州康瑟布拉夫斯 |
us-east1 | 北美洲南卡罗来纳州蒙克斯科纳 |
us-east4 | 北美洲北弗吉尼亚州阿什本 |
us-east5 | 北美洲俄亥俄州哥伦布 |
us-south1 | 北美洲德克萨斯州达拉斯 |
us-west1 | 北美洲俄勒冈州达尔斯 |
us-west2 | 北美洲加利福尼亚州洛杉矶 |
* Cloud Data Fusion 中的数据沿袭功能在 africa-south1、me-central1、me-central1 或 europe-west12 中不受支持。
假设某个 Cloud Data Fusion 实例已运行了 24 小时,并且基本版的免费小时数已用完。下表是各版本的 Cloud Data Fusion 实例费用汇总:
版本 | 费用/小时 | 小时数 | 开发费用 |
|---|---|---|---|
开发者 | $0.35 | 24 | 24*0.35 = $8.4 |
基本 | $1.80 | 24 | 24*1.8 = $43.2 |
企业 | $4.20 | 24 | 24*4.2 = $100.8 |
★ 注意:Cloud Data Fusion 实例一旦预配,就必须始终可用。删除实例后,无法恢复实例,并且所有流水线数据都会丢失。如需了解估算的每月费用,请参阅价格概览。
在这 24 小时内,您每个小时都运行了一条流水线,用于从 Cloud Storage 读取原始数据、执行转换以及向 BigQuery 写入数据。每次运行大约需要 15 分钟。换句话说,为运行这些流水线而创建的这些 Managed Service for Apache Spark 集群每个都持续存在了 15 分钟(0.25 小时)。假设每个 Managed Service for Apache Spark 集群的配置如下:
计费项 | 机器类型 | 虚拟 CPU | 挂接的永久性磁盘 | 在集群中的数量 |
|---|---|---|---|---|
主节点 | n1-standard-4 | 4 | 500 GB | 1 |
工作器节点 | n1-standard-4 | 4 | 500 GB | 5 |
每个 Managed Service for Apache Spark 集群有 24 个虚拟 CPU:4 个用于主节点,20 个分散在工作器节点上。在计费时,Managed Service for Apache Spark 会根据这 24 个虚拟 CPU 以及每个集群运行的时长确定此集群的价格。
就流水线的所有运行而言,Managed Service for Apache Spark 产生的总费用可以按以下公式计算:
Managed Service for Apache Spark 费用 = vCPU 数量 * 集群数量 * 每个集群的小时数 * Managed Service for Apache Spark 价格
= 24 * 24 * 0.25 * $0.01
= $1.44
Managed Service for Apache Spark 集群还会使用其他 Google Cloud 产品,相关的费用将另外结算。具体而言,这些集群将产生 Compute Engine 费用和标准永久性磁盘预配空间费用。您需承担 Cloud Storage 和 BigQuery 的存储费用,具体取决于您的流水线处理的数据量。
如需根据当前费率确定这些额外费用,您可以使用结算计算器。