Preço do Dataproc
Preços do Dataproc no Compute Engine
Os preços do Dataproc no Compute Engine são baseados no tamanho dos clusters do Dataproc e no tempo em que eles são executados. O tamanho de um cluster é baseado no número agregado de CPUs virtuais (vCPUs) em todo o cluster, incluindo os nós de trabalho e mestres. A duração de um cluster é o tempo entre a criação e a interrupção ou exclusão dele.
Os preços do Dataproc são calculados desta forma: $0.010 * # of vCPUs * hourly duration
.
A fórmula de custo usa uma taxa por hora, mas na verdade o Dataproc é faturado por segundo, e todos os clusters desse serviço são cobrados em incrementos de um segundo sujeitos ao faturamento mínimo de um minuto. Para aplicar o preço por hora ao uso de segundo a segundo, o uso é calculado em frações de hora. Por exemplo, 30 minutos são mostrados como 0,5 hora.
O preço do Dataproc é somado ao custo por instância do Compute Engine para cada máquina virtual (consulte Uso de outros recursos do Google Cloud).
Cobranças acumuladas
As seguintes operações e cenários do Dataproc geram cobranças:
Escalonamento e escalonamento automático: quando as VMs são adicionadas ao cluster, as cobranças são acumuladas enquanto as VMs estão ativas. Essas cobranças acumuladas continuam até que as VMs sejam removidas.
Clusters em estado de erro: quando um cluster do Dataproc está em um estado de erro, as VMs do cluster permanecem ativas e as cobranças continuam a ser acumuladas. Essas cobranças acumuladas continuam até que o cluster seja excluído.
Exemplo de preço
Como exemplo, pense em um cluster (com nós mestre e de trabalho) que tenha a configuração a seguir:
Item | Tipo de máquina | CPUs virtuais | Disco permanente anexado | Número no cluster |
---|---|---|---|---|
Nó mestre | n1-standard-4 | 4 | 500 GB | 1 |
Nós de trabalho | n1-standard-4 | 4 | 500 GB | 5 |
Esse cluster do Dataproc tem 24 CPUs virtuais, quatro para o nó mestre e 20 distribuídas pelos nós de trabalho. Para fins de faturamento do Dataproc, o preço desse cluster teria como base as 24 CPUs virtuais e o tempo em que o cluster permaneceu em execução, pressupondo que nenhum nó seja interrompido ou tenha o escalonamento reduzido. Se o cluster for executado por duas horas, o preço do Dataproc usará esta fórmula:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
Nesse exemplo, além do custo do Dataproc, o cluster gera cobranças relacionadas ao Compute Engine e ao espaço provisionado do disco permanente padrão (confira Uso de outros recursos do Google Cloud). A calculadora de faturamento pode ser usada para determinar os custos dos outros recursos do Google Cloud.
Uso de outros recursos do Google Cloud
Como uma solução gerenciada e integrada, o Dataproc é construído sobre outras tecnologias do Google Could. Os clusters do Dataproc consomem os recursos a seguir, sendo cada um deles faturado conforme a determinação de preços:
- Compute Engine: todas as instâncias do Compute Engine em um cluster do Dataproc têm um tempo mínimo de um minuto. Elas são faturadas com base em incrementos de faturamento por segundo e nas regras de preços para uso prolongado.
- Espaço provisionado em disco permanente padrão
- Cloud Monitoring: consulte os preços do Google Cloud Observability
Se quiser, os clusters do Dataproc podem utilizar os recursos a seguir, sendo cada um deles faturado conforme a determinação de preços, incluindo sem limitação:
Preços do Dataproc no GKE
Esta seção explica as cobranças que se aplicam apenas ao cluster virtual do Dataproc que é executado em um GKE gerenciado pelo usuário. Consulte os preços do GKE para saber mais sobre as cobranças adicionais que se aplicam ao cluster do GKE gerenciado pelo usuário.
A fórmula de preços do Dataproc no GKE
($0.010 * # of vCPUs * hourly duration
) é a mesma da fórmula de preços do
Dataproc no Compute Engine e
é aplicada ao número agregado de CPUs virtuais em execução em instâncias de VM em
pools de nós criados pelo Dataproc
no cluster. A duração de uma instância de máquina virtual é o período de tempo
entre a criação e a exclusão. Assim como o Dataproc no Compute Engine,
o Dataproc no GKE é cobrado por segundo, sujeito a um faturamento mínimo de 1 minuto
por instância de máquina virtual. Outros encargos do Google Cloud
são aplicados além das cobranças do Dataproc.
Os pools de nós criados pelo Dataproc continuam existindo após a exclusão do cluster do Dataproc, porque podem ser compartilhados por vários clusters. Se você excluir os pools de nós ou reduzir os pools de nós a zero instâncias, não haverá mais cobranças do Dataproc. As VMs restantes do pool de nós vão continuar gerando cobranças até que sejam excluídas.
Preços do Dataproc sem servidor
Consulte Preços do Dataproc sem servidor.
A seguir
- Leia a documentação do Dataproc.
- Primeiros passos com o Dataproc.
- Use a calculadora de preços.
- Saiba mais sobre soluções e casos de uso do Dataproc.