Ce document explique la tarification de Cloud Data Fusion. Pour les autres produits, consultez la documentation sur les tarifs.
À des fins de tarification, l'utilisation correspond à la durée, en minutes, entre le moment où une instance Cloud Data Fusion est créée et le moment où elle est supprimée. Bien que le tarif soit calculé sur une base horaire, Cloud Data Fusion est facturé à la minute. L'utilisation est mesurée en heures (30 minutes correspondent à 0,5 heure, par exemple) pour appliquer une tarification horaire à une utilisation minute par minute.
Si vous ne payez pas en dollars américains (USD), les tarifs indiqués dans votre devise sur la page des SKU de Google Cloud s'appliquent.
La tarification de Cloud Data Fusion est basée sur deux fonctions : le développement du pipeline et son exécution.
Development
Pour le développement du pipeline, Cloud Data Fusion propose les trois éditions suivantes :
Édition Cloud Data Fusion | Prix (USD) |
|---|---|
Développeur | 0,35 $US / 1 hour |
De base | 0 hour to 120 hour Free per 1 month / account 120 hour and above 1,80 $US / 1 hour, per 1 month / account |
Entreprise | 4,20 $US / 1 hour |
Avec l'édition Basic, les 120 premières heures par mois et par compte sont sans frais.
Exécution
Les clusters Managed Service pour Apache Spark créés par Cloud Data Fusion pour exécuter vos pipelines vous sont facturés sur la base des tarifs actuels de Managed Service pour Apache Spark.
Capacité | Développeur | De base | Entreprise |
|---|---|---|---|
Nombre d'utilisateurs connectés simultanément | 2 | Limité* | Limité* |
Charges de travail | Développement, exploration de produits | Test, bac à sable, démonstration de faisabilité | Production |
Compatibilité avec les adresses IP internes | ✓ | ✓ | ✓ |
Contrôle des accès basé sur les rôles (RBAC) | 🚫 | 🚫 | ✓ |
Conception graphique | ✓ | ✓ | ✓ |
Écosystème de connecteurs | ✓ | ✓ | ✓ |
Transformations visuelles | ✓ | ✓ | ✓ |
Structuré, non structuré, semi-structuré | ✓ | ✓ | ✓ |
Pipelines en streaming | ✓ | ✓ | ✓ |
Traçabilité de l'intégration, au niveau du champ et de l'ensemble de données | ✓ | ✓ | ✓ |
Intégration à Knowledge Catalog | ✓ | ✓ | ✓ |
Haute disponibilité | Zonal | Régional | Régional |
Créer et personnaliser les profils de calcul | ✓ | ✓ | ✓ |
Assistance DevOps : API REST, gestion du contrôle des sources | ✓ | ✓ | ✓ |
Déclencheurs et planifications | ✓ | ✓ | ✓ |
Sélection de l'environnement d'exécution | ✓ | ✓ | ✓ |
Exécution simultanée de pipelines | 🚫 | Limitée** | Limitée** |
SDK de développeur pour l'extensibilité | ✓ | ✓ | ✓ |
* Utilisateurs connectés simultanément : en général, Cloud Data Fusion accepte un maximum de 50 utilisateurs par instance. Si le contrôle des accès basé sur les rôles (RBAC) est activé, le nombre maximal d'utilisateurs est de 25.
** L'exécution simultanée des pipelines est limitée et dépend de la version d'instance utilisée. Pour obtenir des informations sur l'évolutivité, contactez un représentant Google Cloud.
Outre le coût de développement d'une instance Cloud Data Fusion,vous ne payez que les ressources que vous utilisez pour l'exécution de vos pipelines, telles que :
★ Pour créer des jobs de réplication, nous vous recommandons d'appliquer la tarification forfaitaire de BigQuery, et non des tarifs à la demande.
Actuellement, la tarification de Cloud Data Fusion est la même pour toutes les régions où ce service est disponible.
Région | Emplacement |
|---|---|
africa-south1 * | Johannesburg, Afrique du Sud |
asia-east1 | Comté de Changhua, Taïwan |
asia-east2 | Hong Kong |
asia-northeast1 | Tokyo, Japon |
asia-northeast2 | Osaka, Japon |
asia-northeast3 | Séoul, Corée du Sud |
asia-south1 | Mumbai, Inde |
asia-south2 | Delhi, Inde |
asia-southeast1 | Jurong West, Singapour |
asia-southeast2 | Jakarta, Indonésie |
australia-southeast1 | Sydney, Australie |
europe-north1 | Hamina, Finlande |
europe-southwest1 | Madrid, Espagne |
europe-west1 | Saint-Ghislain, Belgique |
europe-west2 | Londres, Angleterre, Royaume-Uni |
europe-west3 | Francfort, Allemagne |
europe-west4 | Eemshaven, Pays-Bas |
europe-west6 | Zurich, Suisse |
europe-west8 | Milan, Italie |
europe-west9 | Paris, France |
europe-west12* | Turin, Italie |
me-central1* | Doha, Qatar |
me-central2* | Dammam, Arabie saoudite |
me-west1 | Tel Aviv, Israël |
northamerica-northeast1 | Montréal, Québec, Canada |
northamerica-south1 | Mexique |
southamerica-east1 | Osasco (São Paulo), Brésil |
southamerica-west1 | Santiago, Chili |
us-central1 | Council Bluffs, Iowa, Amérique du Nord |
us-east1 | Moncks Corner, Caroline du Sud, Amérique du Nord |
us-east4 | Ashburn, Virginie du Nord, Amérique du Nord |
us-east5 | Columbus, Ohio, Amérique du Nord |
us-south1 | Dallas, Texas, Amérique du Nord |
us-west1 | The Dalles, Oregon, Amérique du Nord |
us-west2 | Los Angeles, Californie, Amérique du Nord |
* La traçabilité des données dans Cloud Data Fusion n'est pas disponible dans les régions africa-south1, me-central1, me-central1 ni europe-west12.
Imaginons qu'une instance Cloud Data Fusion s'exécute depuis 24 heures et qu'il ne reste aucune heure sans frais pour l'édition Basic. Les frais d'instance pour chaque édition de Cloud Data Fusion sont récapitulés dans le tableau suivant :
Édition | Coût par heure | Nombre d'heures | Coût de développement |
|---|---|---|---|
Développeur | 0,35 $ | 24 | 24 * 0,35 = 8,40 $ |
De base | 1,80 $ | 24 | 24 * 1,8 = 43,20 $ |
Entreprise | 4,20 $ | 24 | 24 * 4,2 = 100,80 $ |
★ Remarque : Une fois provisionnées, les instances Cloud Data Fusion doivent toujours être disponibles. Après avoir supprimé des instances, vous ne pouvez plus les récupérer et toutes les données de pipeline sont perdues. Pour connaître les coûts mensuels estimés, consultez la présentation des tarifs.
Au cours de cette période de 24 heures, vous avez exécuté un pipeline lisant les données brutes de Cloud Storage, effectué des transformations et écrit les données dans BigQuery toutes les heures. Chaque exécution a pris environ 15 minutes. En d'autres termes, les clusters Managed Service pour Apache Spark créés pour ces exécutions ont été actifs pendant 15 minutes (0,25 heure) chacun. Supposons que la configuration de chaque cluster Managed Service pour Apache Spark soit la suivante :
Élément | Type de machine | Processeurs virtuels | Disque persistant associé | Nombre dans le cluster |
|---|---|---|---|---|
Nœud maître | n1-standard-4 | 4 | 500 Go | 1 |
Nœud de calcul | n1-standard-4 | 4 | 500 Go | 5 |
Les clusters Managed Service pour Apache Spark ont chacun 24 processeurs virtuels : quatre pour le maître et 20 répartis sur les nœuds de calcul. Dans le cadre de la facturation Managed Service pour Apache Spark, le prix serait calculé en fonction de ces 24 processeurs virtuels et de la durée d'exécution de chaque cluster.
Pour toutes les exécutions de votre pipeline, l'ensemble des frais engagés pour Managed Service pour Apache Spark peut être calculé comme suit :
Coût de Managed Service pour Apache Spark = nombre de vCPU * nombre de clusters * nombre d'heures par cluster * prix de Managed Service pour Apache Spark
= 24 * 24 * 0,25 * 0,01 $
= 1,44 $
Les clusters Managed Service pour Apache Spark utilisent d'autres produits Google Cloud, facturés séparément. Plus précisément, ces clusters sont facturés en fonction de l'utilisation de Compute Engine et de l'espace provisionné sur des disques persistants standards. Des frais de stockage pour Cloud Storage et BigQuery vous sont facturés, en fonction de la quantité de données traitées par votre pipeline.
Pour déterminer ces coûts supplémentaires en fonction des tarifs en vigueur, vous pouvez utiliser le simulateur de coût.