Dataproc 价格

Dataproc 价格基于 Dataproc 集群大小和它们运行的时长。集群的大小由整个集群中的虚拟 CPU (vCPU) 总数(包括主节点和工作器节点)决定。集群的运行时长是指集群从创建到删除之间的时间跨度。

虽然本页面上的价格表列出的是小时费率,但 Dataproc 实际上采用按秒计费的方式。所有 Dataproc 集群都以时钟上的一秒为增量来计费,最低计费时间为 1 分钟。用量在结算时会折算为小时数(例如,30 分钟折算为 0.5 小时),以便对按秒计算的用量应用小时定价。

对于每个虚拟机而言,其价格是 Dataproc 价格与 Compute Engine 单实例价格之和,具体如下文所述。Dataproc 集群中的 Compute Engine 资源也是以秒为增量来计费。

Dataproc 支持在集群中使用以下 Compute Engine 实例类型:

标准机器类型

高内存机器类型

高内存机器类型为每个虚拟核心分配 6.50 GB RAM。高内存实例非常适合需要更多内存(相对于虚拟 CPU)的任务。

高 CPU 机器类型

高 CPU 机器类型为每 0.90 GB RAM 分配一个虚拟核心。高 CPU 机器类型非常适合需要更多虚拟 CPU(相对于内存)的任务。

内存优化机器类型

内存优化机器类型非常适合需要使用大量内存的任务,相较于高内存机器类型,其内存与 vCPU 的比率更高。内存优化机器类型为每个虚拟 CPU 分配 15 GB 内存。请参阅区域和地区了解在哪些位置可以使用内存优化机器类型。

自定义机器类型

如果预定义机器类型不适合您的工作负载,您可以创建具有特定数量 vCPU 和内存的自定义机器类型。与运行资源规模更大、费用更高的机器类型相比,如果您并不需要其提供的所有资源,自定义机器类型还可为您节省费用。

Dataproc 对自定义机器类型的收费取决于每个节点的 vCPU 总数。

使用其他 Google Cloud 资源

Dataproc 是一款托管式集成解决方案,以其他 Google Cloud 技术为基础构建而成。Dataproc 集群会使用以下资源,每项资源均按各自的价格收费:

Dataproc 集群可以选择使用以下资源(均按各自的价格收费),包括但不限于:

价格示例

例如,假设采用以下配置的某个集群(具有主节点和工作器节点)在美国的一个地区运行,该地区的 Dataproc 价格为每个虚拟 CPU $0.01。

收费项 机器类型 虚拟 CPU 数 挂接的永久性磁盘 在集群中的数量
主节点 n1-standard-4 4 500 GB 1
工作器节点 n1-standard-4 4 500 GB 5

此 Dataproc 集群有 24 个虚拟 CPU,其中 4 个用于主节点,20 个分散在工作器节点上。在计费时,Dataproc 会根据这 24 个虚拟 CPU 以及此集群运行的时长来确定此集群的价格。例如,如果集群运行了 2 个小时,则 Dataproc 价格将通过以下公式计算:

Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48

在此示例中,集群还使用了其他 Google Cloud 产品,这些产品的费用不包括在 Dataproc 费用中。具体而言,除了 Dataproc 费用以外,此集群还会产生 Compute Engine 费用和标准永久性磁盘预配空间费用。您可以使用帐单计算器来根据当前的费率确定这些单独的费用。