Precios de Dataproc

Los precios de Dataproc se basan en el tamaño de los clústeres de Dataproc y en el tiempo durante el cual se ejecutan. El tamaño de un clúster se basa en el número total de CPU virtuales (vCPU) de todo el clúster, incluidos el nodo maestro y los de trabajador. La duración del clúster es el tiempo comprendido entre la creación del clúster y su eliminación.

Precios de Dataproc

Aunque las tablas de precios que figuran en esta página reflejan las tarifas por hora, Dataproc se factura por segundo. Todos los clústeres de este servicio se cobran en incrementos de un segundo y están sujetos a un cobro mínimo de un minuto. El uso se determina en horas fraccionarias (por ejemplo, 30 minutos son 0,5 horas) para poder aplicar los precios por hora al uso por segundo.

Los precios de Dataproc se suman al precio por instancia de Compute Engine de cada máquina virtual, tal y como se describe más adelante. Dataproc se factura en incrementos por segundo, del mismo modo que los recursos de Compute Engine en un clúster de Dataproc.

Nota: Puedes usar las instancias no garantizadas para reducir tus costes de Compute Engine en los clústeres de Dataproc, pero dichas instancias no cambian la forma en que se factura la versión premium de Dataproc.

En Dataproc se admiten los siguientes tipos de instancias de Compute Engine en los clústeres:

Tipos de máquinas estándar

Tipos de máquinas con alta capacidad de memoria

Estos tipos de máquinas tienen 6,5 GB de RAM por núcleo virtual. Las instancias con alta capacidad de memoria son ideales para tareas que necesitan más memoria con respecto a las CPU virtuales.

Tipos de máquinas con alta capacidad de CPU

Estos tipos de máquinas tienen un núcleo virtual por cada 0,9 GB de RAM. Son ideales para las tareas que requieren más CPU virtuales con respecto a la memoria.

Tipos de máquinas con memoria optimizada

Estos tipos de máquinas son ideales para las tareas que utilizan mucha memoria y precisan una tasa mayor de memoria frente a las vCPU que los tipos de máquinas con alta capacidad de memoria. Los tipos de máquinas con memoria optimizada tienen 15 GB de RAM por CPU virtual. En la sección sobre regiones y zonas tienes un listado con las ubicaciones donde está disponible este tipo de máquina.

Tipos de máquinas personalizadas

Si los tipos de máquinas predefinidas no son los ideales para tus cargas de trabajo, crea un tipo de máquina personalizada con una cantidad específica de vCPUs y de memoria. Los tipos de máquinas personalizadas también te ahorran el coste de ejecutar instancias en un tipo de máquina mayor y más caro, en caso de que no necesites usar todos los recursos de dicho tipo de máquina.

El importe que se cobra en Dataproc por los tipos de máquinas personalizadas depende del número total de vCPUs de cada nodo.

Uso de otros recursos de Google Cloud

Como Dataproc es una solución gestionada e integrada, se ha creado a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos (cada uno de los cuales cuenta con sus propios precios):

Los clústeres de Dataproc también pueden utilizar, entre otros, los siguientes recursos (cada uno de los cuales cuenta con sus propios precios):

Ejemplo de precios

Imagina un clúster (con un nodo maestro y nodos de trabajador) que tiene la siguiente configuración y se está ejecutando en una zona de EE. UU. donde el precio de Dataproc es de 0,01 USD por CPU virtual.

Elemento Tipo de máquina CPU virtuales Disco persistente conectado Número de nodos en el clúster
Nodo maestro n1-standard-4 4 500 GB 1
Nodos de trabajador n1-standard-4 4 500 GB 5

Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo maestro y 20 distribuidas en los nodos de trabajador. A la hora de facturar Dataproc, el precio de este clúster se basaría en esas 24 CPU virtuales y en el tiempo de ejecución del clúster. Por ejemplo, si el clúster se ejecuta durante 2 horas, los precios de Dataproc se calcularían según esta fórmula:

Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48

En este ejemplo, el clúster utiliza otros productos de Google Cloud que se facturarían junto con el cargo correspondiente de Dataproc. Es decir, se cobrarían también los recursos de Compute Engine y el espacio aprovisionado en un disco persistente estándar de este clúster, además del importe correspondiente a Dataproc. Se puede utilizar la calculadora de facturación para determinar esos costes por separado en función de las tarifas actuales.