Dataproc – Preise
Dataproc auf Compute Engine – Preise
Die Preise für Dataproc in der Compute Engine hängen von der Größe der Dataproc-Cluster und ihrer Ausführungsdauer ab. Die Größe eines Clusters basiert auf der Gesamtzahl der virtuellen CPUs (vCPUs) im gesamten Cluster, einschließlich der Master- und Worker-Knoten. Die Laufzeit eines Clusters ist der Zeitraum zwischen dem Erstellen und Stoppen oder Löschen des Clusters.
Die Dataproc-Preisformel lautet: $0.010 * # of vCPUs * hourly duration
.
Obwohl die Preisformel einen Stundensatz beinhaltet, erfolgt die Abrechnung von Dataproc in Sekunden. Das heißt, alle Dataproc-Cluster werden im Sekundentakt abgerechnet, bei einem Minimum von 1 Minute. Die Nutzung wird in Stunden angegeben (30 Minuten sind beispielsweise 0,5 Stunden), um trotz sekundengenauer Abrechnung einen Preis pro Stunde zu erhalten.
Die Dataproc-Preise gelten wie unter Nutzung anderer Google Cloud-Ressourcen beschrieben zusätzlich zum Compute Engine-Preis pro Instanz für jede virtuelle Maschine.
Aufgelaufene Kosten
Bei den folgenden Dataproc-Vorgängen und -Szenarien fallen Gebühren an:
Skalierung und Autoscaling: Wenn VMs dem Cluster hinzugefügt werden, fallen Kosten an, solange die VMs aktiv sind. Diese aufgelaufenen Gebühren werden weiterhin erhoben, bis die VMs entfernt werden.
Cluster im Fehlerzustand: Wenn ein Dataproc-Cluster im Fehlerzustand ist, bleiben die Cluster-VMs aktiv und die Gebühren werden weiter berechnet. Diese aufgelaufenen Gebühren werden weiter berechnet, bis der Cluster gelöscht wird.
Preisbeispiel
Sehen Sie sich als Beispiel einen Cluster (mit Master- und Worker-Knoten) mit der folgenden Konfiguration an:
Posten | Maschinentyp | Virtuelle CPUs | Hinzugefügter nichtflüchtiger Speicher | Anzahl im Cluster |
---|---|---|---|---|
Master-Knoten | n1-standard-4 | 4 | 500 GB | 1 |
Worker-Knoten | n1-standard-4 | 4 | 500 GB | 5 |
Dieser Dataproc-Cluster hat 24 virtuelle CPUs, 4 für den Master und 20 auf die Worker verteilt. Zur Abrechnung von Dataproc würde der Preis für diesen Cluster auf diesen 24 virtuellen CPUs und der Laufzeit des Clusters basieren (vorausgesetzt, dass die Knoten nicht reduziert oder vorzeitig beendet werden). Wenn die Laufzeit des Clusters 2 Stunden beträgt, würde der Dataproc-Preis so berechnet:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
In diesem Beispiel würde der Cluster zusätzlich zur Dataproc-Gebühr auch Kosten für in Compute Engine und im nichtflüchtigen Standardspeicher bereitgestellten Speicher verursachen. Weitere Informationen finden Sie unter Nutzung anderer Google Cloud-Ressourcen. Mit dem Preisrechner können Sie diese separaten Ressourcenkosten für Google Cloud berechnen.
Nutzung anderer Google Cloud-Ressourcen
Dataproc ist eine verwaltete und integrierte Lösung, die auf anderen Google Cloud-Technologien basiert. Dataproc-Cluster verbrauchen die folgenden Ressourcen, für die individuelle Preismodelle bestehen:
- Compute Engine – Alle Compute Engine-Instanzen für einen Dataproc-Cluster werden mit einer Mindestabrechnungszeit von 1 Minute anhand der Preismodellregeln für kontinuierliche Nutzung im Sekundentakt abgerechnet.
- Vom nichtflüchtigen Standardspeicher bereitgestellter Speicherplatz
- Cloud Monitoring – siehe Google Cloud Observability-Preise
Dataproc-Cluster können u. a. die folgenden Ressourcen optional verwenden. Jede Ressource verfügt über ein eigenes Preismodell:
Dataproc auf GKE – Preise
In diesem Abschnitt werden die Gebühren erläutert, die nur für den virtuellen Dataproc-Cluster gelten, der auf einem von Nutzerinnen und Nutzern verwalteten GKE ausgeführt wird. Unter GKE-Preise finden Sie Informationen zu den zusätzlichen Gebühren, die für den von Nutzern verwalteten GKE-Cluster anfallen.
Die Preisformel für Dataproc auf GKE, $0.010 * # of vCPUs * hourly duration
, ist die gleiche wie die für Dataproc auf Compute Engine und wird auf die Gesamtzahl der virtuellen CPUs angewendet, die in VM-Instanzen in von Dataproc erstellten Knotenpools im Cluster ausgeführt werden. Die Dauer einer VM-Instanz ist die Zeitspanne zwischen ihrer Erstellung und ihrem Löschen. Wie bei Dataproc in der Compute Engine wird Dataproc in GKE pro Sekunde abgerechnet, wobei eine Mindestabrechnungszeit von 1 Minute pro virtueller Maschineninstanz gilt. Zusätzlich zu den Dataproc-Gebühren fallen weitere Google Cloud-Gebühren an.
Von Dataproc erstellte Knotenpools bleiben auch nach dem Löschen des Dataproc-Clusters bestehen, da sie möglicherweise von mehreren Clustern gemeinsam genutzt werden. Wenn Sie die Knotenpools löschen oder auf null Instanzen herunterskalieren, fallen keine weiteren Dataproc-Gebühren an. Für alle verbleibenden Knotenpool-VMs fallen weiterhin Gebühren an, bis Sie sie löschen.
Dataproc Serverless – Preise
Siehe Dataproc Serverless-Preise.
Nächste Schritte
- Lesen Sie die Dataproc-Dokumentation.
- Jetzt mit Dataproc starten
- Preisrechner ausprobieren
- Informationen zu Dataproc-Lösungen und -Anwendungsfällen