Tarifs de Dataproc
- Tarifs de Dataproc sur Compute Engine
- Tarifs de Dataproc sur GKE
- Tarification de Serverless pour Apache Spark
Tarifs de Dataproc sur Compute Engine
Les tarifs de Dataproc sur Compute Engine sont basés sur la taille et la durée d'exécution des clusters Dataproc. La taille dépend du nombre total de processeurs virtuels sur l'ensemble du cluster, y compris les nœuds maîtres et de calcul. La durée d'exécution correspond à la période comprise entre la création du cluster et son arrêt ou sa suppression.
La formule tarifaire appliquée pour Dataproc est la suivante : $0.010 * # of vCPUs * hourly duration.
Bien que les tarifs soient exprimés sous forme de taux horaire, Dataproc est facturé à la seconde et tous les clusters Dataproc sont facturés par tranche d'une seconde, avec une facturation minimale d'une minute. L'utilisation est mesurée en fractions d'heures (par exemple, 30 minutes correspondent à 0,5 heure) afin d'appliquer un tarif horaire à l'utilisation à la seconde près.
Les tarifs de Dataproc s'ajoutent au prix par instance de Compute Engine pour chaque machine virtuelle (voir Utilisation d'autres ressources Google Cloud).
Frais cumulés
Les opérations et scénarios Dataproc suivants entraînent des frais :
Scaling et autoscaling : Lorsque vous ajoutez des VM au cluster, des frais s'accumulent tant que les VM sont actives. Ces frais continuent de s'accumuler jusqu'à ce que les VM soient supprimées.
Clusters à l'état "Erreur" : lorsqu'un cluster Dataproc est à l'état "Erreur", les VM du cluster restent actives et les frais continuent de s'accumuler. Ces frais continuent de s'accumuler jusqu'à ce que le cluster soit supprimé.
Exemple de tarification
Prenons l'exemple d'un cluster (avec nœud maître et nœud de calcul) présentant la configuration suivante :
| Élément | Type de machine | Processeurs virtuels | Disque persistant associé | Nombre dans le cluster |
|---|---|---|---|---|
| Nœud maître | n1-standard-4 | 4 | 500 Go | 1 |
| Nœuds de calcul | n1-standard-4 | 4 | 500 Go | 5 |
Ce cluster Dataproc contient 24 processeurs virtuels, 4 pour le nœud maître et 20 répartis entre les nœuds de calcul. Dans le cadre de la facturation Dataproc, le prix serait calculé en fonction de ces 24 processeurs virtuels et de la durée d'exécution du cluster (si aucun nœud n'est réduit ni préempté). Si le cluster s'exécute pendant 2 heures, Dataproc serait facturé selon la formule suivante :
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
Dans cet exemple de cluster, des frais seraient également facturés pour l'utilisation de Compute Engine et l'espace provisionné sur le disque persistant standard, en plus des coûts liés à Dataproc (voir Utilisation d'autres Google Cloud ressources). Le simulateur de facturation vous permet de calculer ces coûts de ressources additionnels. Google Cloud
Utilisation d'autres ressources Google Cloud
Solution gérée et intégrée, Dataproc repose sur d'autres technologies Google Cloud. Les clusters Dataproc consomment les ressources suivantes, chacune faisant l'objet d'une facturation spécifique :
- Compute Engine : toutes les instances Compute Engine d'un cluster Dataproc font l'objet d'une facturation minimale d'une minute, par tranche d'une seconde et selon les règles de tarification en cas d'utilisation soutenue.
- Espace provisionné sur disque persistant standard.
- Cloud Monitoring : consultez la page Tarifs de Google Cloud Observability.
Les clusters Dataproc peuvent aussi utiliser les ressources suivantes, chacune faisant l'objet d'une facturation spécifique, y compris, mais sans s'y limiter :
Tarifs de Dataproc sur GKE
Cette section explique les frais qui s'appliquent uniquement au cluster Dataproc virtuel exécuté sur un cluster GKE géré par l'utilisateur. Consultez les tarifs de GKE pour en savoir plus sur les frais supplémentaires qui s'appliquent au cluster GKE géré par l'utilisateur.
La formule de tarification de Dataproc sur GKE, $0.010 * # of vCPUs * hourly duration, est la même que celle de Dataproc sur Compute Engine. Elle s'applique au nombre total de processeurs virtuels exécutés dans les instances de VM des pools de nœuds créés par Dataproc dans le cluster. La durée d'une instance de machine virtuelle correspond à la période entre sa création et sa suppression. Comme pour Dataproc sur Compute Engine, Dataproc sur GKE est facturé à la seconde, avec un minimum d'une minute par instance de machine virtuelle. D'autres Google Cloud frais
s'appliquent en plus des frais Dataproc.
Les pools de nœuds créés par Dataproc continuent d'exister après la suppression du cluster Dataproc, car ils peuvent être partagés par plusieurs clusters. Si vous supprimez les pools de nœuds ou réduisez leur taille à zéro instance, vous n'aurez plus à payer de frais Dataproc. Les VM restantes du pool de nœuds continueront à générer des frais jusqu'à ce que vous les supprimiez.
Tarification de Serverless pour Apache Spark
Consultez la page Tarifs de Serverless pour Apache Spark.
Étape suivante
- Consultez la documentation Dataproc.
- Premiers pas avec Dataproc.
- Essayez le Simulateur de coût.
- Découvrez les solutions et cas d'utilisation Dataproc.