Prezzi di Dataproc
- Prezzi di Dataproc su Compute Engine
- Prezzi di Dataproc su GKE
- Prezzi di Serverless per Apache Spark
Prezzi di Dataproc su Compute Engine
I prezzi di Dataproc su Compute Engine si basano sulle dimensioni e sul tempo di esecuzione dei cluster Dataproc. Le dimensioni di un cluster si basano sul numero complessivo di CPU virtuali (vCPU) nell'intero cluster, che includono nodi master e nodi worker. La durata di un cluster è il periodo di tempo che intercorre tra la creazione e l'arresto o l'eliminazione del cluster.
La formula per la determinazione del prezzo di Dataproc è: $0.010 * # of vCPUs * hourly duration.
Anche se la formula per la determinazione del prezzo è espressa come tariffa oraria, Dataproc viene fatturato al secondo e tutti i cluster Dataproc sono fatturati in incrementi di 1 secondo, con fatturazione minima di 1 minuto. L'utilizzo è espresso in frazioni di ore (ad esempio, 30 minuti sono pari a 0,5 ore) al fine di applicare una tariffa oraria a un utilizzo al secondo.
I prezzi di Dataproc si aggiungono al prezzo per istanza di Compute Engine per ogni macchina virtuale (consulta Utilizzo di altre risorse di Google Cloud).
Addebiti maturati
Le seguenti operazioni e scenari di Dataproc comportano l'addebito di costi:
Scalabilità e scalabilità automatica: quando le VM vengono aggiunte al cluster, vengono addebitate mentre sono attive. Questi addebiti maturati continuano fino alla rimozione delle VM.
Cluster in stato di errore: quando un cluster Dataproc è in stato di errore, le VM del cluster rimangono attive e gli addebiti continuano ad accumularsi. Questi addebiti maturati continuano fino all'eliminazione del cluster.
Esempio di prezzi
Consideriamo un cluster (con nodi master e nodi worker) con la configurazione seguente:
| Elemento | Tipo di macchina | CPU virtuali | Disco permanente collegato | Numero nel cluster |
|---|---|---|---|---|
| Nodo master | n1-standard-4 | 4 | 500 GB | 1 |
| Nodi worker | n1-standard-4 | 4 | 500 GB | 5 |
Questo cluster Dataproc ha 24 CPU virtuali, 4 per il master e 20 distribuite tra i nodi worker. Ai fini della fatturazione di Dataproc, il prezzo per questo cluster si baserebbe sulle 24 CPU virtuali e sul periodo di tempo in cui ogni cluster è stato in esecuzione (supponendo che nessun nodo sia scalato verso il basso o prerilasciato). Se il cluster è in esecuzione per 2 ore, il prezzo di Dataproc utilizzerà la seguente formula:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
In questo esempio, il cluster comporterebbe inoltre addebiti per Compute Engine e per lo spazio sottoposto a provisioning su disco permanente standard in aggiunta al costo di Dataproc (consulta Utilizzo di altre Google Cloud risorse). Il Calcolatore prezzi può aiutarti a determinare i costi separati delle Google Cloud risorse.
Utilizzo di altre risorse di Google Cloud
In quanto soluzione gestita e integrata, Dataproc si basa su altre tecnologie di Google Cloud. I cluster Dataproc consumano le seguenti risorse, ognuna delle quali è fatturata secondo i relativi prezzi:
- Compute Engine: tutte le istanze di Compute Engine per un cluster Dataproc hanno un tempo minimo di un minuto e sono fatturate in incrementi di un secondo e in base alle regole di fatturazione per l'utilizzo sostenuto.
- Spazio con provisioning su disco permanente standard
- Cloud Monitoring: vedi i prezzi di Google Cloud Observability
I cluster Dataproc possono utilizzare le seguenti risorse, ognuna delle quali fatturata secondo i relativi prezzi, tra cui a titolo esemplificativo:
Prezzi di Dataproc su GKE
Questa sezione spiega gli addebiti che si applicano solo al cluster Dataproc virtuale in esecuzione su un GKE gestito dall'utente. Consulta i prezzi di GKE per scoprire di più sui costi aggiuntivi applicati al cluster GKE gestito dall'utente.
La formula di prezzo di Dataproc su GKE, $0.010 * # of vCPUs * hourly duration, è la stessa della formula di prezzo di Dataproc su Compute Engine e viene applicata al numero aggregato di CPU virtuali in esecuzione nelle istanze VM nei pool di nodi creati da Dataproc nel cluster. La durata di un'istanza di macchina virtuale è il periodo di tempo
che intercorre tra la sua creazione e la sua eliminazione. Come per Dataproc su Compute Engine,
Dataproc su GKE viene fatturato al secondo, con un minimo di 1 minuto di fatturazione
per ogni istanza di macchina virtuale. Altri Google Cloud costi
vengono applicati in aggiunta ai costi di Dataproc.
I pool di nodi creati da Dataproc continuano a esistere dopo l'eliminazione del cluster Dataproc perché potrebbero essere condivisi da più cluster. Se elimini i pool di nodi o ridimensioni i pool di nodi fino a zero istanze, non verranno addebitati costi Dataproc continui. Le VM del pool di nodi rimanenti continueranno a generare addebiti finché non le elimini.
Prezzi di Serverless per Apache Spark
Consulta i prezzi di Serverless per Apache Spark.
Passaggi successivi
- Leggi la documentazione di Dataproc.
- Inizia a utilizzare Dataproc.
- Prova il Calcolatore prezzi.
- Scopri di più su soluzioni e casi d'uso di Dataproc.