Precios de Dataproc

Los precios de Dataproc se calculan según el tamaño de los clústeres de Dataproc y por cuánto tiempo se ejecutan. El tamaño de un clúster se calcula según la cantidad total de CPU virtuales de todo el clúster, incluidos los nodos trabajadores y los principales. La duración de un clúster es la cantidad de tiempo que transcurre entre su creación y eliminación.

Esta es la fórmula para calcular los precios de Dataproc: $0.010 * # of vCPUs * hourly duration.

Si bien la fórmula para calcular el precio se expresa como una tarifa por hora, Dataproc se factura por segundo y todos los clústeres de Dataproc se facturan en incrementos de tiempo de un segundo y están sujetos a una facturación mínima de 1 minuto. El uso se expresa en fracciones de hora (por ejemplo, 30 minutos se expresan como 0.5 horas) para aplicar los precios por hora al uso por segundos.

Los precios de Dataproc se suman al precio por instancia de Compute Engine para cada máquina virtual (consulta la página sobre el uso de otros recursos de Google Cloud).

Ejemplo de precios

Por ejemplo, considera un clúster (con una instancia principal y nodos trabajadores) que tiene la siguiente configuración:

Elemento Tipo de máquina CPU virtuales Disco persistente conectado Cantidad en el clúster
Nodo principal n1-standard-4 4 500 GB 1
Nodos trabajadores n1-standard-4 4 500 GB 5

Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo principal y 20 distribuidas entre los nodos trabajadores. Para los propósitos de facturación de Dataproc y si suponemos que no se disminuyó la escala de los nodos ni se interrumpieron, el precio de este clúster se calcularía según esas 24 CPU virtuales y la cantidad de tiempo durante el que se ejecutó ese clúster. Si el clúster se ejecuta durante 2 horas, se usaría la siguiente fórmula de precios de Dataproc:

Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48

En este ejemplo, el clúster también tendría cobros asociados a Compute Engine y al espacio de disco persistente estándar, además del cobro de Dataproc (consulta la sección Uso de otros recursos de Google Cloud). Se puede usar la calculadora de facturación para determinar los costos de los recursos de Google Cloud por separado.

Uso de otros recursos de Google Cloud

Como una solución integrada y administrada, Dataproc se creó a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos, cada uno facturado según sus propios precios:

De manera opcional, los clústeres de Dataproc pueden usar recursos, que se facturan según sus propios precios, entre los que se encuentran los siguientes: