Tarifs de Dataproc
Tarifs de Dataproc sur Compute Engine
Les tarifs de Dataproc sur Compute Engine sont basés sur la taille et la durée d'exécution des clusters Dataproc. La taille d'un cluster est basée sur le nombre total de processeurs virtuels sur l'ensemble du cluster, y compris les nœuds maîtres et de calcul. La durée d'un cluster correspond au délai entre sa création et son arrêt ou sa suppression.
La formule tarifaire appliquée pour Dataproc est la suivante : $0.010 * # of vCPUs * hourly duration
.
Bien que les tarifs soient exprimés sous forme de taux horaire, Dataproc est facturé à la seconde et tous les clusters Dataproc sont facturés par tranche d'une seconde, avec une facturation minimale d'une minute. L'utilisation est mesurée en fractions d'heures (par exemple, 30 minutes correspondent à 0,5 heure) afin d'appliquer un tarif horaire à l'utilisation à la seconde près.
Les tarifs de Dataproc s'ajoutent au prix par instance de Compute Engine pour chaque machine virtuelle (voir Utilisation d'autres ressources Google Cloud).
.Exemple de tarification
Prenons l'exemple d'un cluster (avec nœud maître et nœud de calcul) présentant la configuration suivante :
Élément | Type de machine | Processeurs virtuels | Disque persistant associé | Nombre dans le cluster |
---|---|---|---|---|
Nœud maître | n1-standard-4 | 4 | 500 Go | 1 |
Nœuds de calcul | n1-standard-4 | 4 | 500 Go | 5 |
Ce cluster Dataproc contient 24 processeurs virtuels, 4 pour le nœud maître et 20 répartis entre les nœuds de calcul. Dans le cadre de la facturation Dataproc, le prix serait calculé en fonction de ces 24 processeurs virtuels et de la durée d'exécution du cluster (si aucun nœud n'est réduit ni préempté). Si le cluster s'exécute pendant 2 heures, Dataproc serait facturé selon la formule suivante :
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
Dans cet exemple de cluster, des frais seraient également facturés pour l'utilisation de Compute Engine et l'espace provisionné sur le disque persistant standard, en plus des coûts liés à Dataproc (voir Utilisation d'autres ressources Google Cloud). Le simulateur de coût permet de déterminer les coûts distincts des ressources Google Cloud.
Utilisation d'autres ressources Google Cloud
Solution gérée et intégrée, Dataproc repose sur d'autres technologies Google Cloud. Les clusters Dataproc consomment les ressources suivantes, chacune faisant l'objet d'une facturation spécifique :
- Compute Engine : toutes les instances Compute Engine d'un cluster Dataproc font l'objet d'une facturation minimale d'une minute, par tranche d'une seconde et selon les règles de tarification en cas d'utilisation soutenue.
- Espace provisionné sur disque persistant standard.
- Cloud Monitoring : consultez les tarifs de Google Cloud pour l'observabilité.
Les clusters Dataproc peuvent aussi utiliser les ressources suivantes, chacune faisant l'objet d'une facturation spécifique, y compris, mais sans s'y limiter :
Tarifs de Dataproc sur GKE
Cette section décrit les frais qui ne s'appliquent qu'au cluster Dataproc virtuel qui s'exécute sur un cluster GKE géré par l'utilisateur. Consultez les tarifs de GKE pour en savoir plus sur les frais supplémentaires qui s'appliquent au cluster GKE géré par l'utilisateur.
La formule de tarification de Dataproc sur GKE, $0.010 * # of vCPUs * hourly duration
, est identique à la formule de tarification de Dataproc sur Compute Engine. Elle s'applique au nombre total de processeurs virtuels exécutés sur des instances de VM dans les pools de nœuds créés par Dataproc dans le cluster. La durée d'une instance de machine virtuelle correspond au temps écoulé entre sa création et sa suppression. Comme pour Dataproc sur Compute Engine, Dataproc sur GKE est facturé à la seconde, avec une facturation minimale d'une minute par instance de machine virtuelle. D'autres frais Google Cloud s'appliquent en plus des frais Dataproc.
Les pools de nœuds créés par Dataproc continuent d'exister après la suppression du cluster Dataproc, car ils peuvent être partagés par plusieurs clusters. Si vous supprimez les pools de nœuds ou effectuez le scaling des pools de nœuds jusqu'à zéro instance, les frais liés à Dataproc ne vous seront pas facturés. Les VM restantes du pool de nœuds continueront d'être facturées jusqu'à ce que vous les supprimiez.
Tarifs de Dataproc sans serveur
Consultez la page Tarifs de Dataproc sans serveur.
Étapes suivantes
- Consultez la documentation Dataproc.
- Premiers pas avec Dataproc.
- Essayez le Simulateur de coût.
- Découvrez les solutions et cas d'utilisation Dataproc.