Precios de Dataproc
Precios de Dataproc en Compute Engine
Los precios de Dataproc en Compute Engine se basan en el tamaño de los clústeres de Dataproc y en el tiempo que se ejecutan. El tamaño de un clúster se calcula según la cantidad total de CPU virtuales de todo el clúster, incluidos los nodos trabajadores y los principales. La duración de un clúster es el tiempo que transcurre entre su creación y detención o eliminación.
Esta es la fórmula para calcular los precios de Dataproc: $0.010 * # of vCPUs * hourly duration
.
Si bien la fórmula para calcular el precio se expresa como una tarifa por hora, Dataproc se factura por segundo y todos los clústeres de Dataproc se facturan en incrementos de tiempo de un segundo y están sujetos a una facturación mínima de 1 minuto. El uso se expresa en fracciones de hora (por ejemplo, 30 minutos se expresan como 0.5 horas) para aplicar los precios por hora al uso por segundos.
Los precios de Dataproc se suman al precio por instancia de Compute Engine para cada máquina virtual (consulta la página sobre el uso de otros recursos de Google Cloud).
Ejemplo de precios
Por ejemplo, considera un clúster (con una instancia principal y nodos trabajadores) que tiene la siguiente configuración:
Artículo | Tipo de máquina | CPU virtuales | Disco persistente conectado | Cantidad en el clúster |
---|---|---|---|---|
Nodo principal | n1-standard-4 | 4 | 500 GB | 1 |
Nodos trabajadores | n1-standard-4 | 4 | 500 GB | 5 |
Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo principal y 20 distribuidas entre los nodos trabajadores. Para los propósitos de facturación de Dataproc y si suponemos que no se disminuyó la escala de los nodos ni se interrumpieron, el precio de este clúster se calcularía según esas 24 CPU virtuales y la cantidad de tiempo durante el que se ejecutó ese clúster. Si el clúster se ejecuta durante 2 horas, se usaría la siguiente fórmula de precios de Dataproc:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
En este ejemplo, el clúster también tendría cobros asociados a Compute Engine y al espacio de disco persistente estándar, además del cobro de Dataproc (consulta la sección Uso de otros recursos de Google Cloud). Puedes usar la calculadora de facturación para determinar los costos de los recursos de Google Cloud por separado.
Uso de otros recursos de Google Cloud
Como una solución integrada y administrada, Dataproc se creó a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos, cada uno facturado según sus propios precios:
- Compute Engine: todas las instancias de Compute Engine de un clúster de Dataproc tienen un mínimo de 1 minuto y se facturan en función de los incrementos de facturación por segundo y las reglas de fijación de precios por uso continuo
- Espacio aprovisionado de disco persistente estándar
- Cloud Monitoring: Consulta los precios de Google Cloud's operations suite
De manera opcional, los clústeres de Dataproc pueden usar recursos, que se facturan según sus propios precios, entre los que se encuentran los siguientes:
Precios de Dataproc en GKE
En esta sección, se explican los cargos que se aplican solo al clúster virtual de Dataproc que se ejecuta en un GKE administrado por el usuario. Consulta los precios de GKE para obtener información sobre los cargos adicionales que se aplican al clúster de GKE administrado por el usuario.
La fórmula de precios de Dataproc en GKE, $0.010 * # of vCPUs * hourly duration
, es la misma que la fórmula de precios de Dataproc en Compute Engine y se aplica a la cantidad total de CPU virtuales que se ejecutan en instancias de VM en grupos de nodos creados por Dataproc en el clúster. La duración de una instancia de máquina virtual es el tiempo que transcurre desde su creación hasta su eliminación. Al igual que con Dataproc en Compute Engine, Dataproc en GKE se factura por segundo, sujeto a una facturación mínima de 1 minuto por instancia de máquina virtual. Se aplican otros cargos de Google Cloud además de los de Dataproc.
Los grupos de nodos creados por Dataproc continúan existiendo después de la eliminación del clúster de Dataproc, ya que varios clústeres pueden compartirlos. Si borras los grupos de nodos o escalas a cero instancias, no se generarán cargos continuos de Dataproc. Las VM restantes del grupo de nodos seguirán generando cargos hasta que las borres.
Precios de Dataproc Serverless
Consulta Precios de Dataproc Serverless.
¿Qué sigue?
- Lee la documentación de Dataproc.
- Comienza a usar Dataproc.
- Prueba la calculadora de precios.
- Obtén información sobre las soluciones y los casos de uso de Dataproc.