Tarifs AI Platform Prediction

AI Platform Prediction propose des tarifs souples et évolutifs, adaptés à votre projet et à votre budget. AI Platform Prediction facture l'obtention de prédictions, mais la gestion de vos ressources de machine learning dans le cloud est gratuite.

Présentation de la tarification

Les tableaux suivants récapitulent les tarifs associés à chaque région où AI Platform Prediction est disponible.

Consultez les tarifs d'AI Platform Training.

Tarifs des prédictions

Le tableau suivant indique le coût par heure de nœud des prédictions par lot et en ligne. Les nœuds-heure correspondent au temps durant lequel une machine virtuelle exécute une tâche de prédiction ou durant lequel elle est disponible pour traiter les requêtes de prédiction. En savoir plus sur le calcul des coûts de prédiction

Amériques

Prédiction
Prédiction par lot 0,0791205 $ par nœud-heure
Prédiction en ligne
Types de machines – prix par nœud-heure
mls1-c1-m2 (par défaut)

0,045147 $

mls1-c4-m2 (version bêta)

0,151962 $

n1-standard-2 Tarifs approximatifs :
us-east4 0,107 $
northamerica-northeast1 0,1046 $
Autres régions des Amériques 0,095 $
n1-standard-4 Tarifs approximatifs :
us-east4 0,214 $
northamerica-northeast1 0,2092 $
Autres régions des Amériques 0,1901 $
n1-standard-8 Tarifs approximatifs :
us-east4 0,428 $
northamerica-northeast1 0,4183 $
Autres régions des Amériques 0,3802 $
n1-standard-16 Tarifs approximatifs :
us-east4 0,8559 $
northamerica-northeast1 0,8367 $
Autres régions des Amériques 0,7603 $
n1-standard-32 Tarifs approximatifs :
us-east4 1,7119 $
northamerica-northeast1 1,6733 $
Autres régions des Amériques 1,5207 $
n1-highmem-2 Tarifs approximatifs :
us-east4 0,1332 $
northamerica-northeast1 0,1302 $
Autres régions des Amériques 0,1184 $
n1-highmem-4 Tarifs approximatifs :
us-east4 0,2665 $
northamerica-northeast1 0,2605 $
Autres régions des Amériques 0,2367 $
n1-highmem-8 Tarifs approximatifs :
us-east4 0,5329 $
northamerica-northeast1 0,5209 $
Autres régions des Amériques 0,4735 $
n1-highmem-16 Tarifs approximatifs :
us-east4 1,0659 $
northamerica-northeast1 1,0419 $
Autres régions des Amériques 0,947 $
n1-highmem-32 Tarifs approximatifs :
us-east4 2,1317 $
northamerica-northeast1 2,0838 $
Autres régions des Amériques 1,894 $
n1-highcpu-2 Tarifs approximatifs :
us-east4 0,0798 $
northamerica-northeast1 0,078 $
Autres régions des Amériques 0,0709 $
n1-highcpu-4 Tarifs approximatifs :
us-east4 0,1596 $
northamerica-northeast1 0,156 $
Autres régions des Amériques 0,1417 $
n1-highcpu-8 Tarifs approximatifs :
us-east4 0,3192 $
northamerica-northeast1 0,312 $
Autres régions des Amériques 0,2834 $
n1-highcpu-16 Tarifs approximatifs :
us-east4 0,6384 $
northamerica-northeast1 0,624 $
Autres régions des Amériques 0,5669 $
n1-highcpu-32 Tarifs approximatifs :
us-east4 1,2768 $
northamerica-northeast1 1,248 $
Autres régions des Amériques 1,1338 $

Europe

Prédiction
Prédiction par lot 0,086118 $ par nœud-heure
Prédiction en ligne
Types de machines – prix par nœud-heure
mls1-c1-m2 (par défaut)

0,044095 $

mls1-c4-m2 (version bêta)

0,148414 $

n1-standard-2 Tarifs approximatifs :
europe-west2 0,1224 $
europe-west3 0,1224 $
Autres régions d'Europe 0,11 $
n1-standard-4 Tarifs approximatifs :
europe-west2 0,2448 $
europe-west3 0,2448 $
Autres régions d'Europe 0,2201 $
n1-standard-8 Tarifs approximatifs :
europe-west2 0,4896 $
europe-west3 0,4896 $
Autres régions d'Europe 0,4401 $
n1-standard-16 Tarifs approximatifs :
europe-west2 0,9792 $
europe-west3 0,9792 $
Autres régions d'Europe 0,8802 $
n1-standard-32 Tarifs approximatifs :
europe-west2 1,9583 $
europe-west3 1,9583 $
Autres régions d'Europe 1,7605 $
n1-highmem-2 Tarifs approximatifs :
europe-west2 0,1524 $
europe-west3 0,1524 $
Autres régions d'Europe 0,137 $
n1-highmem-4 Tarifs approximatifs :
europe-west2 0,3048 $
europe-west3 0,3048 $
Autres régions d'Europe 0,274 $
n1-highmem-8 Tarifs approximatifs :
europe-west2 0,6097 $
europe-west3 0,6097 $
Autres régions d'Europe 0,548 $
n1-highmem-16 Tarifs approximatifs :
europe-west2 1,2193 $
europe-west3 1,2193 $
Autres régions d'Europe 1,0959 $
n1-highmem-32 Tarifs approximatifs :
europe-west2 2,4386 $
europe-west3 2,4386 $
Autres régions d'Europe 2,1918 $
n1-highcpu-2 Tarifs approximatifs :
europe-west2 0,0913 $
europe-west3 0,0913 $
Autres régions d'Europe 0,0821 $
n1-highcpu-4 Tarifs approximatifs :
europe-west2 0,1826 $
europe-west3 0,1826 $
Autres régions d'Europe 0,1642 $
n1-highcpu-8 Tarifs approximatifs :
europe-west2 0,3651 $
europe-west3 0,3651 $
Autres régions d'Europe 0,3284 $
n1-highcpu-16 Tarifs approximatifs :
europe-west2 0,7303 $
europe-west3 0,7303 $
Autres régions d'Europe 0,6567 $
n1-highcpu-32 Tarifs approximatifs :
europe-west2 1,4606 $
europe-west3 1,4606 $
Autres régions d'Europe 1,3134 $

Asie-Pacifique

Prédiction
Prédiction par lot 0,086118 $ par nœud-heure
Prédiction en ligne
Types de machines – prix par nœud-heure
mls1-c1-m2 (par défaut)

0,051456 $

mls1-c4-m2 (version bêta)

0,17331 $

n1-standard-2 Tarifs approximatifs :
asia-east1 0,11 $
asia-northeast1 0,1219 $
asia-southeast1 0,1172 $
australia-southeast1 0,1348 $
n1-standard-4 Tarifs approximatifs :
asia-east1 0,2201 $
asia-northeast1 0,2438 $
asia-southeast1 0,2344 $
australia-southeast1 0,2696 $
n1-standard-8 Tarifs approximatifs :
asia-east1 0,4401 $
asia-northeast1 0,4875 $
asia-southeast1 0,4688 $
australia-southeast1 0,5392 $
n1-standard-16 Tarifs approximatifs :
asia-east1 0,8802 $
asia-northeast1 0,975 $
asia-southeast1 0,9375 $
australia-southeast1 1,0784 $
n1-standard-32 Tarifs approximatifs :
asia-east1 1,7605 $
asia-northeast1 1,9501 $
asia-southeast1 1,8751 $
australia-southeast1 2,1567 $
n1-highmem-2 Tarifs approximatifs :
asia-east1 0,137 $
asia-northeast1 0,1517 $
asia-southeast1 0,1459 $
australia-southeast1 0,1679 $
n1-highmem-4 Tarifs approximatifs :
asia-east1 0,274 $
asia-northeast1 0,3034 $
asia-southeast1 0,2919 $
australia-southeast1 0,3357 $
n1-highmem-8 Tarifs approximatifs :
asia-east1 0,548 $
asia-northeast1 0,6067 $
asia-southeast1 0,5837 $
australia-southeast1 0,6714 $
n1-highmem-16 Tarifs approximatifs :
asia-east1 1,0959 $
asia-northeast1 1,2135 $
asia-southeast1 1,1675 $
australia-southeast1 1,3428 $
n1-highmem-32 Tarifs approximatifs :
asia-east1 2,1918 $
asia-northeast1 2,4269 $
asia-southeast1 2,335 $
australia-southeast1 2,6857 $
n1-highcpu-2 Tarifs approximatifs :
asia-east1 0,0821 $
asia-northeast1 0,091 $
asia-southeast1 0,0874 $
australia-southeast1 0,1005 $
n1-highcpu-4 Tarifs approximatifs :
asia-east1 0,1642 $
asia-northeast1 0,182 $
asia-southeast1 0,1748 $
australia-southeast1 0,2011 $
n1-highcpu-8 Tarifs approximatifs :
asia-east1 0,3284 $
asia-northeast1 0,364 $
asia-southeast1 0,3496 $
australia-southeast1 0,4021 $
n1-highcpu-16 Tarifs approximatifs :
asia-east1 0,6567 $
asia-northeast1 0,7279 $
asia-southeast1 0,6992 $
australia-southeast1 0,8043 $
n1-highcpu-32 Tarifs approximatifs :
asia-east1 1,3134 $
asia-northeast1 1,4558 $
asia-southeast1 1,3985 $
australia-southeast1 1,6085 $

Les types de machines Compute Engine (N1) pour la prédiction en ligne ne sont disponibles que sur les points de terminaison régionaux et apparaissent comme deux codes SKU distincts sur votre facture Google Cloud :

  • Coût du processeur virtuel, mesuré en processeurs virtuels-heure
  • Coût de la mémoire RAM, mesurée en Go-heure

Les tarifs des types de machines Compute Engine (N1) indiqués dans le tableau précédent sont basés sur une approximation du coût horaire total pour chaque nœud de prédiction d'une version de modèle utilisant ce type de machine. Par exemple, étant donné qu'un type de machine n1-highcpu-32 inclut 32 processeurs virtuels et 28,8 Go de mémoire RAM, le tarif horaire par nœud est égal à 32 processeurs virtuels-heure + 28,8 Go-heure.

Les tarifs indiqués dans le tableau précédent sont fournis pour vous aider à estimer vos coûts de prédiction en ligne. Le tableau suivant indique les coûts des processeurs virtuels et de la mémoire RAM pour les types de machines Compute Engine (N1), qui reflètent plus précisément les codes SKU qui vous seront facturés :

Amériques

SKU du type de machine Compute Engine (N1)
Processeur virtuel
Virginie du Nord (us-east4) 0,035605 $ par processeur virtuel-heure
Montréal (northamerica-northeast1) 0,034802 $ par processeur virtuel-heure
Autres régions des Amériques 0,031613 $ par processeur virtuel-heure
Mémoire RAM
Virginie du Nord (us-east4) 0,004771 $ par Go-heure
Montréal (northamerica-northeast1) 0,004664 $ par Go-heure
Autres régions des Amériques 0,004242 $ par Go-heure

Europe

SKU du type de machine Compute Engine (N1)
Processeur virtuel
Londres (europe-west2) 0,04073 $ par processeur virtuel-heure
Francfort (europe-west3) 0,04073 $ par processeur virtuel-heure
Autres régions d'Europe 0,036632 $ par processeur virtuel-heure
Mémoire RAM
Londres (europe-west2) 0,005458 $ par Go-heure
Francfort (europe-west3) 0,005458 $ par Go-heure
Autres régions d'Europe 0,004902 $ par Go-heure

Asie-Pacifique

SKU du type de machine Compute Engine (N1)
Processeur virtuel
Taïwan (asia-east1) 0,036632 $ par processeur virtuel-heure
Tokyo (asia-northeast1) 0,040618 $ par processeur virtuel-heure
Singapour (asia-southeast1) 0,038999 $ par processeur virtuel-heure
Sydney (australia-southeast1) 0,044856 $ par processeur virtuel-heure
Mémoire RAM
Taïwan (asia-east1) 0,004902 $ par Go-heure
Tokyo (asia-northeast1) 0,005419 $ par Go-heure
Singapour (asia-southeast1) 0,005226 $ par Go-heure
Sydney (australia-southeast1) 0,006011 $ par Go-heure

Vous pouvez également utiliser des accélérateurs GPU pour la prédiction en ligne avec les types de machines Compute Engine (N1). Les GPU entraînent des frais supplémentaires en plus de ceux décrits dans le tableau précédent. Le tableau suivant indique les tarifs pour chaque type de GPU :

Amériques

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80 0,4500 $
NVIDIA_TESLA_P4
Iowa (us-central1) 0,6000 $
Virginie du Nord (us-east4) 0,6000 $
Montréal (northamerica-northeast1) 0,6500 $
NVIDIA_TESLA_P100 1,4600 $
NVIDIA_TESLA_T4 0,3500 $
NVIDIA_TESLA_V100 2,4800 $

Europe

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80 0,4900 $
NVIDIA_TESLA_P4 0,6500 $
NVIDIA_TESLA_P100 1,6000 $
NVIDIA_TESLA_T4
Londres (europe-west2) 0,4100 $
Pays-Bas (europe-west4) 0,3800 $
NVIDIA_TESLA_V100 2,5500 $

Asie-Pacifique

Accélérateurs – Prix par heure
NVIDIA_TESLA_K80 0,4900 $
NVIDIA_TESLA_P4
Singapour (asia-southeast1) 0,6500 $
Sydney (australia-southeast1) 0,6500 $
NVIDIA_TESLA_P100 1,6000 $
NVIDIA_TESLA_T4
Tokyo (asia-northeast1) 0,3700 $
Singapour (asia-southeast1) 0,3700 $
NVIDIA_TESLA_V100 Non disponible

Veuillez noter que les tarifs sont indiqués par GPU. Aussi, si vous utilisez plusieurs GPU par nœud de prédiction (ou si votre version évolue pour utiliser plusieurs nœuds), les coûts évoluent en conséquence.

Remarques :

  1. Toute utilisation est soumise aux règles de quotas d'AI Platform Prediction.
  2. Vous devez stocker vos données et vos fichiers de programme dans des buckets Google Cloud Storage pendant le cycle de vie d'AI Platform Prediction. En savoir plus sur l'utilisation de Cloud Storage
  3. Pour les remises basées sur le volume, contactez l'équipe commerciale.
  4. Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page relative aux SKU de Cloud Platform s'appliquent.

Simulateur de coût

Utilisez le simulateur de coût afin d'obtenir l'estimation des frais liés à l'entraînement et aux prédictions.

Plus d'informations sur les frais liés aux prédictions

AI Platform Prediction réalise des prédictions à partir de votre modèle en exécutant plusieurs machines virtuelles ("nœuds"). Par défaut, AI Platform Prediction adapte automatiquement le nombre de nœuds en cours d'exécution à tout moment. Pour la prédiction en ligne, le nombre de nœuds s'adapte en fonction de la demande. Chaque nœud peut répondre à plusieurs requêtes de prédiction. Pour la prédiction par lot, le nombre de nœuds s'adapte afin de réduire la durée totale d'exécution de la tâche. Vous pouvez personnaliser le scaling des nœuds de prédiction.

Pour votre modèle, la durée d'exécution de chaque nœud vous est facturée, y compris dans les cas suivants :

  • Lorsque le nœud traite une tâche de prédiction par lot
  • Lorsque le nœud traite une requête de prédiction en ligne
  • Lorsque le nœud est disponible pour les prédictions en ligne

L'heure de nœud correspond au coût d'exécution d'un nœud durant une heure. Le tableau des tarifs relatifs aux prédictions indique le prix d'un nœud-heure, qui varie selon les régions et le type de prédiction (en ligne ou par lot).

Les nœuds-heure peuvent être fractionnés afin d'être consommés par tranches. Par exemple, l'exécution d'un nœud durant 30 minutes coûte 0,5 nœud-heure. Toutefois, plusieurs règles régissent le calcul des coûts :

Calcul des coûts pour les anciens types de machines (MLS1) et la prédiction par lot

  • La durée d'exécution d'un nœud se mesure par tranches d'une minute et est arrondie à la minute supérieure. Par exemple, si un nœud s'exécute durant 20,1 minutes, son coût d'exécution sera calculé sur la base de 21 minutes.
  • Les durées d'exécution de nœud inférieures à 10 minutes sont arrondies à 10 minutes. Par exemple, si un nœud s'exécute durant 3 minutes seulement, son coût d'exécution sera calculé sur la base de 10 minutes.

Calcul des coûts pour les types de machines Compute Engine (N1)

  • La durée d'exécution d'un nœud est facturée par tranches de 30 secondes. Ainsi, toutes les 30 secondes, votre projet est facturé pour 30 secondes d'utilisation des processeurs virtuels, de la mémoire RAM et des ressources GPU alors utilisés par votre nœud.

Informations supplémentaires sur le scaling automatique des nœuds de prédiction

Prédiction en ligne Prédiction par lot
La priorité du scaling est de réduire la latence des requêtes individuelles. Le service permet à votre modèle de rester disponible pendant quelques minutes d'inactivité après le traitement d'une requête. La priorité du scaling est de réduire le temps total de la tâche.
Le scaling a un effet sur le montant total qui vous est facturé chaque mois : plus vos requêtes sont nombreuses et fréquentes, plus le volume de nœuds utilisés est important. Le scaling doit avoir peu d'effet sur le prix de votre tâche, même si la création d'un nœud engendre des frais.

Vous pouvez choisir de laisser le service s'adapter en fonction du trafic (scaling automatique) ou définir un nombre de nœuds à exécuter en permanence pour éviter la latence (scaling manuel).

  • Si vous sélectionnez le scaling automatique, le nombre de nœuds évolue automatiquement et peut être réduit à zéro pour les périodes sans trafic.
  • Si vous sélectionnez le scaling manuel, vous spécifiez un nombre de nœuds à exécuter en permanence. La totalité du temps d'exécution des nœuds vous est alors facturée, du déploiement jusqu'à la suppression de la version du modèle.
Vous pouvez modifier le scaling en définissant un nombre maximal de nœuds à utiliser pour une tâche de prédiction par lot et en définissant le nombre de nœuds à exécuter pour un modèle lorsque vous le déployez.

Coût minimal de 10 minutes

Souvenez-vous que si un nœud s'exécute pendant moins de 10 minutes, vous serez quand même facturé 10 minutes. Par exemple, supposons que vous utilisiez le scaling automatique. Durant une période sans trafic, aucun nœud n'est utilisé. La réception d'une seule requête de prédiction en ligne déclenche l'exécution d'un nœud pour traiter la requête. Après avoir traité la requête, le nœud continue de s'exécuter et reste disponible quelques minutes. Ensuite, il s'arrête. Même si le nœud a fonctionné moins de 10 minutes, son exécution vous est facturée 10 minutes de nœud (0,17 nœud-heure).

De même, si un nœud est ajouté pour traiter plusieurs requêtes de prédiction en ligne pendant 10 minutes avant de s'arrêter, vous serez facturé 10 minutes de nœud.

Vous pouvez utiliser le scaling manuel pour contrôler précisément le nombre de nœuds à exécuter durant une période donnée. Toutefois, si un nœud s'exécute pendant moins de 10 minutes, vous êtes quand même facturé 10 minutes.

En savoir plus sur la répartition et le scaling des nœuds

Exemple de calcul de frais liés aux prédictions

Une agence immobilière implantée dans la région des Amériques exécute une prédiction hebdomadaire de la valeur des biens immobiliers dans la zone qu'elle couvre. En un mois, elle exécute des prédictions pendant quatre semaines, par lots de 3920, 4277, 3849 et 3961. Les tâches sont traitées par un seul nœud, et chaque instance nécessite en moyenne 0.72 seconde de traitement.

Commencez par calculer la durée d'exécution de chaque tâche :

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

L'exécution de chaque tâche a duré plus de 10 minutes, et sera donc facturée à la minute de traitement.

($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

Le coût total s'élève à 0,26 $ pour le mois.

Dans cet exemple, nous avons supposé que les tâches s'exécutaient sur un seul nœud et prenaient le même temps pour chaque instance d'entrée. En utilisation réelle, veillez à prendre en compte plusieurs nœuds et à utiliser le temps d'exécution effectif de chacun d'eux dans vos calculs.

Remarque sur les frais d'AI Platform Prediction pour AI Explanations

AI Explanations est disponible sans frais supplémentaires sur AI Platform Prediction. Cependant, le traitement des explications est plus long que celui des prédictions standards. L'utilisation intensive d'AI Explanations avec l'autoscaling peut donc entraîner le démarrage de davantage de nœuds, et ainsi augmenter vos frais sur AI Platform Prediction.

Utilisation obligatoire de Cloud Storage

En plus des coûts décrits dans ce document, vous devez stocker vos données et vos fichiers de programme dans des buckets Cloud Storage pendant le cycle de vie d'AI Platform Prediction. Ce stockage est soumis aux règles de tarification de Cloud Storage.

L'utilisation obligatoire de Cloud Storage comprend ce qui suit :

  • Préproduction de vos fichiers de modèle lorsque vous êtes prêt à déployer une version de modèle

  • Stockage de vos données d'entrée pour la prédiction par lot

  • Stockage des résultats de vos tâches de prédiction par lot (le stockage à long terme de ces éléments dans AI Platform Prediction n'est pas nécessaire ; vous pouvez supprimer les fichiers dès que l'opération est terminée)

Opérations gratuites pour la gestion de vos ressources

Les opérations de gestion des ressources proposées par AI Platform Prediction sont disponibles gratuitement. Toutefois, les règles de quotas d'AI Platform Prediction limitent certaines de ces opérations.

Ressource Opérations gratuites
modèles create, get, list et delete
versions create, get, list, delete et setDefault
tâches get, list et cancel
opérations get, list, cancel et delete

Étape suivante

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial