Precios de Dataproc

Los precios de Dataproc se basan en el tamaño de sus clústeres y en el tiempo durante el que se ejecutan. El tamaño de un clúster se basa en el número total de CPU virtuales (vCPU) de todo el clúster, incluidos el nodo maestro y los de trabajador. La duración del clúster es el tiempo comprendido entre su creación y su eliminación.

Los precios de Dataproc se calculan según esta fórmula: $0.010 * # of vCPUs * hourly duration.

Aunque en la fórmula figura una tarifa por hora, en Dataproc se aplica la facturación por segundo. Todos los clústeres de este servicio se cobran en incrementos de un segundo y están sujetos a un cobro mínimo de un minuto. El uso se determina en horas fraccionarias (por ejemplo, 30 minutos son 0,5 horas) para poder aplicar los precios por hora al uso por segundo.

Los precios de Dataproc se suman al precio por instancia de Compute Engine de cada máquina virtual (consulta la sección Uso de otros recursos de Google Cloud).

Ejemplo de precios

Imagina un clúster (con un nodo maestro y nodos de trabajador) que tiene la siguiente configuración:

Elemento Tipo de máquina CPU virtuales Disco persistente conectado Número de nodos en el clúster
Nodo maestro n1‑standard‑4 4 500 GB 1
Nodos de trabajador n1‑standard‑4 4 500 GB 5

Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo maestro y 20 distribuidas entre los nodos de trabajador. En la facturación de Dataproc, el precio del clúster se basaría en las 24 CPU virtuales y en el tiempo que ha estado ejecutándose (eso es, suponiendo que ningún nodo se ha escalado en horizontal ni se ha interrumpido temporalmente). Por lo tanto, si el clúster se ejecuta durante 2 horas, los precios de Dataproc se calcularían según esta fórmula:

Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48

En este ejemplo, además de los cargos de Dataproc, se cobrarían también el uso de Compute Engine y el espacio aprovisionado de un disco persistente estándar (consulta la sección Uso de otros recursos de Google Cloud). Se puede utilizar la calculadora de facturación para determinar los costes de los recursos de Google Cloud por separado.

Uso de otros recursos de Google Cloud

Como Dataproc es una solución gestionada e integrada, se ha creado a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos (cada uno con su propio precio):

Los clústeres de Dataproc también pueden utilizar, entre otros, los siguientes recursos (cada uno con su propio precio):