Dataproc 价格
Compute Engine 上的 Dataproc 价格
Compute Engine 上的 Dataproc 价格取决于 Dataproc 集群的大小及其运行时长。集群的大小取决于整个集群中的虚拟 CPU (vCPU) 的总数,包括主节点和工作器节点。集群的运行时长是指从集群创建到停止或删除集群之间的时间长度。
Dataproc 价格公式为:$0.010 * # of vCPUs * hourly duration
。
尽管价格公式以每小时费率表示,但所有 Dataproc 集群都以时钟上的一秒为增量来计费,最低计费时间为 1 分钟。用量在结算时会折算为小时数(例如,30 分钟折算为 0.5 小时),以便对按秒计算的用量应用小时定价。
对于每台虚拟机而言,其价格是 Dataproc 价格与 Compute Engine 单实例价格之和(请参阅使用其他 Google Cloud 资源)。
价格示例
例如,假设某个集群(具有主节点和工作器节点)采用以下配置:
错误 | 机器类型 | 虚拟 CPU 数 | 挂接的永久性磁盘 | 在集群中的数量 |
---|---|---|---|---|
主节点 | n1-standard-4 | 4 | 500 GB | 1 |
工作器节点 | n1-standard-4 | 4 | 500 GB | 5 |
此 Dataproc 集群有 24 个虚拟 CPU,其中 4 个用于主节点,20 个分散在工作器节点上。在计费时,Dataproc 会根据这 24 个虚拟 CPU 以及此集群运行的时长来确定此集群的价格(假设没有节点被缩减或被抢占)。如果集群运行了 2 个小时,则 Dataproc 价格将通过以下公式计算:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
在此示例中,除了 Dataproc 费用之外,集群还会产生 Compute Engine 费用和标准 Persistent Disk 预配空间费用(请参阅使用其他 Google Cloud 资源)。您可以使用结算计算器来确定单独的 Google Cloud 资源费用。
使用其他 Google Cloud 资源
Dataproc 是一款代管式集成解决方案,以其他 Google Cloud 技术为基础构建而成。Dataproc 集群会使用以下资源,每项资源均按各自的价格收费:
- Compute Engine - Dataproc 集群的所有 Compute Engine 实例均以秒为增量并按持续使用价格规则来计费,最低按时钟上的 1 分钟收费。
- Standard Persistent Disk 预配空间
- Cloud Monitoring - 请参阅 Google Cloud 可观测性价格
Dataproc 集群可以选择使用以下资源(均按各自的价格收费),包括但不限于:
Dataproc on GKE 价格
本部分介绍的费用仅适用于在用户管理的 GKE 上运行的虚拟 Dataproc 集群。如需了解用户管理的 GKE 集群适用的额外费用,请参阅 GKE 价格。
GKE 上的 Dataproc 价格公式 $0.010 * # of vCPUs * hourly duration
与 Compute Engine 上的 Dataproc 价格公式相同,适用于集群中由 Dataproc 创建的节点池内的虚拟机实例中运行的虚拟 CPU 总数。虚拟机实例的时长是指从创建到删除所需的时间。与 Compute Engine 上的 Dataproc 一样,GKE 上的 Dataproc 按秒计费,每个虚拟机实例至少按 1 分钟计费。除了 Dataproc 费用外,您还需要支付其他 Google Cloud 费用。
删除 Dataproc 集群后,Dataproc 创建的节点池将继续存在,因为它们可能由多个集群共享。如果您删除节点池或将节点池缩减到零个实例,则不会继续产生 Dataproc 费用。任何剩余的节点池虚拟机将继续产生费用,直到您将其删除。
Dataproc 无服务器价格
请参阅 Dataproc 无服务器价格。
后续步骤
- 阅读 Dataproc 文档。
- 开始使用 Dataproc。
- 试用价格计算器。
- 了解 Dataproc 解决方案和使用场景。