Precios de Dataproc
Precios de Dataproc en Compute Engine
Los precios de Dataproc en Compute Engine se basan en el tamaño de los clústeres de Dataproc y la cantidad de tiempo en que se ejecutan. El tamaño de un clúster se calcula según la cantidad total de CPU virtuales de todo el clúster, incluidos los nodos trabajadores y los principales. La duración de un clúster es el período entre su creación y la detención o eliminación.
Esta es la fórmula para calcular los precios de Dataproc: $0.010 * # of vCPUs * hourly duration
.
Si bien la fórmula para calcular el precio se expresa como una tarifa por hora, Dataproc se factura por segundo y todos los clústeres de Dataproc se facturan en incrementos de tiempo de un segundo y están sujetos a una facturación mínima de 1 minuto. El uso se expresa en fracciones de hora (por ejemplo, 30 minutos se expresan como 0.5 horas) para aplicar los precios por hora al uso por segundos.
Los precios de Dataproc se suman al precio por instancia de Compute Engine para cada máquina virtual (consulta la página sobre el uso de otros recursos de Google Cloud).
Cargos acumulados
Las siguientes operaciones y situaciones de Dataproc generan cargos:
Escalamiento y ajuste de escala automático: Cuando se agregan VMs al clúster, los cargos se acumulan mientras las VMs están activas. Estos cargos acumulados continúan hasta que se quitan las VMs.
Clúster en estado de error: Cuando un clúster de Dataproc está en estado de error, las VMs del clúster permanecen activas y los cargos siguen acumulándose. Estos cargos acumulados continúan hasta que se borra el clúster.
Ejemplo de precios
Por ejemplo, considera un clúster (con una instancia principal y nodos trabajadores) que tiene la siguiente configuración:
Elemento | Tipo de máquina | CPU virtuales | Disco persistente conectado | Cantidad en el clúster |
---|---|---|---|---|
Nodo principal | n1-standard-4 | 4 | 500 GB | 1 |
Nodos trabajadores | n1-standard-4 | 4 | 500 GB | 5 |
Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo principal y 20 distribuidas entre los nodos trabajadores. Para los propósitos de facturación de Dataproc y si suponemos que no se disminuyó la escala de los nodos ni se interrumpieron, el precio de este clúster se calcularía según esas 24 CPU virtuales y la cantidad de tiempo durante el que se ejecutó ese clúster. Si el clúster se ejecuta durante 2 horas, se usaría la siguiente fórmula de precios de Dataproc:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
En este ejemplo, el clúster también tendría cobros asociados a Compute Engine y al espacio de disco persistente estándar, además del cobro de Dataproc (consulta la sección Uso de otros recursos de Google Cloud). Se puede usar la calculadora de facturación para determinar los costos de los recursos de Google Cloud por separado.
Uso de otros recursos de Google Cloud
Como una solución integrada y administrada, Dataproc se creó a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos, cada uno facturado según sus propios precios:
- Compute Engine: todas las instancias de Compute Engine de un clúster de Dataproc tienen un mínimo de 1 minuto y se facturan en función de los incrementos de facturación por segundo y las reglas de fijación de precios por uso continuo
- Espacio aprovisionado de disco persistente estándar
- Cloud Monitoring: consulta Precios de Google Cloud Observability
De manera opcional, los clústeres de Dataproc pueden usar recursos, que se facturan según sus propios precios, entre los que se encuentran los siguientes:
Precios de Dataproc en GKE
En esta sección, se explican los cargos que se aplican solo al clúster virtual de Dataproc que se ejecuta en un GKE administrado por el usuario. Consulta los precios de GKE para obtener más información sobre los cargos adicionales que se aplican al clúster de GKE administrado por el usuario.
La fórmula de precios de Dataproc en GKE, $0.010 * # of vCPUs * hourly duration
, es la misma que la fórmula de precios de
Dataproc en Compute Engine y se aplica a la cantidad agregada de CPU virtuales que se ejecutan en instancias de VM en
grupos de nodos creados por Dataproc
en el clúster. La duración de una instancia de máquina virtual es el período
que va desde su creación hasta su eliminación. Al igual que Dataproc en Compute Engine,
Dataproc en GKE se factura por segundo, sujeto a una facturación mínima de 1 minuto
por instancia de máquina virtual. Se aplican otros cargos de Google Cloud
además de los de Dataproc.
Los grupos de nodos creados por Dataproc siguen existiendo después de la eliminación del clúster de Dataproc, ya que pueden ser compartidos por varios clústeres. Si borras los grupos de nodos o reduces la escala de los grupos de nodos a cero instancias, no se seguirán generando cargos de Dataproc. Las VMs de los grupos de nodos restantes seguirán generando cargos hasta que las borres.
Precios de Dataproc Serverless
Consulta Precios de Dataproc Serverless.
¿Qué sigue?
- Lee la documentación de Dataproc.
- Comienza a usar Dataproc.
- Prueba la calculadora de precios.
- Obtén información sobre las soluciones y los casos de uso de Dataproc.