Prezzi di Dataproc
- Prezzi di Dataproc su Compute Engine
- Prezzi di Dataproc su GKE
- Prezzi di Serverless per Apache Spark
Prezzi di Dataproc su Compute Engine
I prezzi di Dataproc su Compute Engine si basano sulle dimensioni e sul tempo di esecuzione dei cluster Dataproc. Le dimensioni di un cluster si basano sul numero complessivo di CPU virtuali (vCPU) nell'intero cluster, che includono nodi master e nodi worker. La durata di un cluster è il periodo di tempo che intercorre tra la creazione e l'arresto o l'eliminazione del cluster.
La formula per la determinazione del prezzo di Dataproc è: $0.010 * # of vCPUs * hourly duration.
Anche se la formula per la determinazione del prezzo è espressa come tariffa oraria, Dataproc viene fatturato al secondo e tutti i cluster Dataproc sono fatturati in incrementi di 1 secondo, con fatturazione minima di 1 minuto. L'utilizzo è espresso in frazioni di ore (ad esempio, 30 minuti sono pari a 0,5 ore) al fine di applicare una tariffa oraria a un utilizzo al secondo.
I prezzi di Dataproc si aggiungono al prezzo per istanza di Compute Engine per ogni macchina virtuale (consulta Utilizzo di altre risorse di Google Cloud).
Addebiti maturati
Le seguenti operazioni e scenari di Dataproc comportano l'addebito di costi:
Scalabilità e scalabilità automatica: quando si aggiungono VM al cluster, vengono addebitati costi per il periodo di tempo in cui le VM sono attive. Questi addebiti maturati continuano fino alla rimozione delle VM.
Cluster in stato di errore: quando un cluster Dataproc è in stato di errore, le VM del cluster rimangono attive e gli addebiti continuano ad accumularsi. Questi addebiti maturati continuano fino all'eliminazione del cluster.
Esempio di prezzi
Consideriamo un cluster (con nodi master e nodi worker) con la configurazione seguente:
| Elemento | Tipo di macchina | CPU virtuali | Disco permanente collegato | Numero nel cluster |
|---|---|---|---|---|
| Nodo master | n1-standard-4 | 4 | 500 GB | 1 |
| Nodi worker | n1-standard-4 | 4 | 500 GB | 5 |
Questo cluster Dataproc ha 24 CPU virtuali, 4 per il master e 20 distribuite tra i nodi worker. Ai fini della fatturazione di Dataproc, il prezzo per questo cluster si baserebbe sulle 24 CPU virtuali e sul periodo di tempo in cui ogni cluster è stato in esecuzione (supponendo che nessun nodo sia scalato verso il basso o prerilasciato). Se il cluster è in esecuzione per 2 ore, il prezzo di Dataproc utilizzerà la seguente formula:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
In questo esempio, il cluster comporterebbe inoltre addebiti per Compute Engine e per lo spazio sottoposto a provisioning su disco permanente standard in aggiunta al costo di Dataproc (consulta Utilizzo di altre Google Cloud risorse). Il Calcolatore prezzi può aiutarti a determinare i costi separati delle Google Cloud risorse.
Utilizzo di altre risorse di Google Cloud
In quanto soluzione gestita e integrata, Dataproc si basa su altre tecnologie di Google Cloud. I cluster Dataproc consumano le seguenti risorse, ognuna delle quali è fatturata secondo i relativi prezzi:
- Compute Engine: tutte le istanze di Compute Engine per un cluster Dataproc hanno un tempo minimo di un minuto e sono fatturate in incrementi di un secondo e in base alle regole di fatturazione per l'utilizzo sostenuto.
- Spazio con provisioning su disco permanente standard
- Cloud Monitoring: vedi i prezzi di Google Cloud Observability
I cluster Dataproc possono utilizzare le seguenti risorse, ognuna delle quali fatturata secondo i relativi prezzi, tra cui a titolo esemplificativo:
Prezzi di Dataproc su GKE
Questa sezione spiega gli addebiti che si applicano solo al cluster Dataproc virtuale in esecuzione su un GKE gestito dall'utente. Consulta i prezzi di GKE per scoprire di più sui costi aggiuntivi applicati al cluster GKE gestito dall'utente.
La formula di prezzo di Dataproc su GKE, $0.010 * # of vCPUs * hourly duration, è la stessa della formula di prezzo di Dataproc su Compute Engine e viene applicata al numero aggregato di CPU virtuali in esecuzione nelle istanze VM nei pool di nodi creati da Dataproc nel cluster. La durata di un'istanza di macchina virtuale è il periodo di tempo che intercorre
tra la sua creazione e la sua eliminazione. Come per Dataproc su Compute Engine,
Dataproc su GKE viene fatturato al secondo, con una fatturazione minima di 1 minuto
per istanza di macchina virtuale. Altri Google Cloud costi
vengono applicati in aggiunta ai costi di Dataproc.
I pool di nodi creati da Dataproc continuano a esistere dopo l'eliminazione del cluster Dataproc perché potrebbero essere condivisi da più cluster. Se elimini i pool di nodi o ridimensioni i pool di nodi fino a zero istanze, non verranno addebitati costi Dataproc aggiuntivi. Le VM del pool di nodi rimanenti continueranno a generare addebiti finché non le eliminerai.
Prezzi di Serverless per Apache Spark
Consulta i prezzi di Serverless per Apache Spark.
Passaggi successivi
- Leggi la documentazione di Dataproc.
- Inizia a utilizzare Dataproc.
- Prova il Calcolatore prezzi.
- Scopri di più su soluzioni e casi d'uso di Dataproc.