AI Platform Prediction propose des tarifs souples et évolutifs, adaptés à votre projet et à votre budget. AI Platform Prediction facture l'obtention de prédictions, mais la gestion de vos ressources de machine learning dans le cloud est gratuite.
Présentation de la tarification
Les tableaux suivants récapitulent les tarifs associés à chaque région où AI Platform Prediction est disponible.
Consultez les tarifs d'AI Platform Training.
Tarifs des prédictions
Le tableau suivant indique le coût par nœud-heure des prédictions par lot et en ligne. Les nœuds-heure correspondent au temps durant lequel une machine virtuelle exécute une tâche de prédiction ou durant lequel elle est disponible pour traiter les requêtes de prédiction. En savoir plus sur le calcul des coûts de prédiction
Amériques
Prédiction | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Prédiction par lot | 0,0791205 $ par nœud-heure | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prédiction en ligne |
|
Europe
Prédiction | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Prédiction par lot | 0,086118 $ par nœud-heure | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prédiction en ligne |
|
Asie-Pacifique
Prédiction | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Prédiction par lot | 0,086118 $ par nœud-heure | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Prédiction en ligne |
|
Les types de machines Compute Engine (N1) pour la prédiction en ligne ne sont disponibles que sur les points de terminaison régionaux et apparaissent comme deux codes SKU distincts sur votre facture Google Cloud :
- Coût du processeur virtuel, mesuré en processeurs virtuels-heure
- Coût de la mémoire RAM, mesurée en Go-heure
Les tarifs des types de machines Compute Engine (N1) indiqués dans le tableau précédent sont basés sur une approximation du coût horaire total pour chaque nœud de prédiction d'une version de modèle utilisant ce type de machine. Par exemple, étant donné qu'un type de machine n1-highcpu-32
inclut 32 processeurs virtuels et 28,8 Go de mémoire RAM, le tarif horaire par nœud est égal à 32 processeurs virtuels-heure + 28,8 Go-heure.
Les tarifs indiqués dans le tableau précédent sont fournis pour vous aider à estimer vos coûts de prédiction en ligne. Le tableau suivant indique les coûts des processeurs virtuels et de la mémoire RAM pour les types de machines Compute Engine (N1), qui reflètent plus précisément les codes SKU qui vous seront facturés :
Amériques
SKU du type de machine Compute Engine (N1) | |||||||
---|---|---|---|---|---|---|---|
Processeur virtuel |
|
||||||
Mémoire RAM |
|
Europe
SKU du type de machine Compute Engine (N1) | |||||||
---|---|---|---|---|---|---|---|
Processeur virtuel |
|
||||||
Mémoire RAM |
|
Asie-Pacifique
SKU du type de machine Compute Engine (N1) | |||||||||
---|---|---|---|---|---|---|---|---|---|
Processeur virtuel |
|
||||||||
Mémoire RAM |
|
Vous pouvez également utiliser des accélérateurs GPU pour la prédiction en ligne avec les types de machines Compute Engine (N1). Les GPU entraînent des frais supplémentaires en plus de ceux décrits dans le tableau précédent. Le tableau suivant indique les tarifs pour chaque type de GPU :
Amériques
Accélérateurs – Prix par heure | |||||||
---|---|---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,4500 $ | ||||||
NVIDIA_TESLA_P4
|
|
||||||
NVIDIA_TESLA_P100
|
1,4600 $ | ||||||
NVIDIA_TESLA_T4
|
0,3500 $ | ||||||
NVIDIA_TESLA_V100
|
2,4800 $ |
Europe
Accélérateurs – Prix par heure | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,4900 $ | ||||
NVIDIA_TESLA_P4
|
0,6500 $ | ||||
NVIDIA_TESLA_P100
|
1,6000 $ | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
2,5500 $ |
Asie-Pacifique
Accélérateurs – Prix par heure | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,4900 $ | ||||
NVIDIA_TESLA_P4
|
|
||||
NVIDIA_TESLA_P100
|
1,6000 $ | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
Non disponible |
Veuillez noter que les tarifs sont indiqués par GPU. Aussi, si vous utilisez plusieurs GPU par nœud de prédiction (ou si votre version évolue pour utiliser plusieurs nœuds), les coûts évoluent en conséquence.
Remarques :
- Toute utilisation est soumise aux règles de quotas d'AI Platform Prediction.
- Vous devez stocker vos données et vos fichiers de programme dans des buckets Google Cloud Storage pendant le cycle de vie d'AI Platform Prediction. En savoir plus sur l'utilisation de Cloud Storage
- Pour les remises basées sur le volume, contactez l'équipe commerciale.
- Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU Cloud Platform s'appliquent.
Simulateur de coût
Utilisez le simulateur de coût afin d'obtenir l'estimation des frais liés à l'entraînement et aux prédictions.
Plus d'informations sur les frais liés aux prédictions
AI Platform Prediction réalise des prédictions à partir de votre modèle en exécutant plusieurs machines virtuelles ("nœuds"). Par défaut, AI Platform Prediction adapte automatiquement le nombre de nœuds en cours d'exécution à tout moment. Pour la prédiction en ligne, le nombre de nœuds s'adapte en fonction de la demande. Chaque nœud peut répondre à plusieurs requêtes de prédiction. Pour la prédiction par lot, le nombre de nœuds s'adapte afin de réduire la durée totale d'exécution de la tâche. Vous pouvez personnaliser le scaling des nœuds de prédiction.
Pour votre modèle, la durée d'exécution de chaque nœud vous est facturée, y compris dans les cas suivants :
- Lorsque le nœud traite une tâche de prédiction par lot
- Lorsque le nœud traite une requête de prédiction en ligne
- Lorsque le nœud est disponible pour les prédictions en ligne
Un nœud-heure correspond au coût d'exécution d'un nœud durant une heure. Le tableau des tarifs relatifs aux prédictions indique le prix d'un nœud-heure, qui varie selon les régions et le type de prédiction (en ligne ou par lot).
Les nœuds-heure peuvent être fractionnés afin d'être consommés par tranches. Par exemple, l'exécution d'un nœud durant 30 minutes coûte 0,5 nœud-heure. Toutefois, plusieurs règles régissent le calcul des coûts :
Calcul des coûts pour les anciens types de machines (MLS1) et la prédiction par lot
- La durée d'exécution d'un nœud se mesure par tranches d'une minute et est arrondie à la minute supérieure. Par exemple, si un nœud s'exécute durant 20,1 minutes, son coût d'exécution sera calculé sur la base de 21 minutes.
- Les durées d'exécution de nœud inférieures à 10 minutes sont arrondies à 10 minutes. Par exemple, si un nœud s'exécute durant 3 minutes seulement, son coût d'exécution sera calculé sur la base de 10 minutes.
Calcul des coûts pour les types de machines Compute Engine (N1)
- La durée d'exécution d'un nœud est facturée par tranches de 30 secondes. Ainsi, toutes les 30 secondes, votre projet est facturé pour 30 secondes d'utilisation des processeurs virtuels, de la mémoire RAM et des ressources GPU alors utilisés par votre nœud.
Informations supplémentaires sur le scaling automatique des nœuds de prédiction
Prédiction en ligne | Prédiction par lot |
---|---|
La priorité du scaling est de réduire la latence des requêtes individuelles. Le service permet à votre modèle de rester disponible pendant quelques minutes d'inactivité après le traitement d'une requête. | La priorité du scaling est de réduire le temps total de la tâche. |
Le scaling a un effet sur le montant total qui vous est facturé chaque mois : plus vos requêtes sont nombreuses et fréquentes, plus le volume de nœuds utilisés est important. | Le scaling doit avoir peu d'effet sur le prix de votre tâche, même si la création d'un nœud engendre des frais. |
Vous pouvez choisir de laisser le service s'adapter en fonction du trafic (scaling automatique) ou définir un nombre de nœuds à exécuter en permanence pour éviter la latence (scaling manuel).
|
Vous pouvez modifier le scaling en définissant un nombre maximal de nœuds à utiliser pour une tâche de prédiction par lot et en définissant le nombre de nœuds à exécuter pour un modèle lorsque vous le déployez. |
Coût minimal de 10 minutes
Souvenez-vous que si un nœud s'exécute pendant moins de 10 minutes, vous serez quand même facturé 10 minutes. Par exemple, supposons que vous utilisiez le scaling automatique. Durant une période sans trafic, aucun nœud n'est utilisé. La réception d'une seule requête de prédiction en ligne déclenche l'exécution d'un nœud pour traiter la requête. Après avoir traité la requête, le nœud continue de s'exécuter et reste disponible quelques minutes. Ensuite, il s'arrête. Même si le nœud a fonctionné moins de 10 minutes, son exécution vous est facturée 10 minutes de nœud (0,17 nœud-heure).
De même, si un nœud est ajouté pour traiter plusieurs requêtes de prédiction en ligne pendant 10 minutes avant de s'arrêter, vous serez facturé 10 minutes de nœud.
Vous pouvez utiliser le scaling manuel pour contrôler précisément le nombre de nœuds à exécuter durant une période donnée. Toutefois, si un nœud s'exécute pendant moins de 10 minutes, vous êtes quand même facturé 10 minutes.
En savoir plus sur l'attribution et le scaling des nœuds
Exemple de calcul de frais liés aux prédictions
Une agence immobilière implantée dans la région des Amériques exécute une prédiction hebdomadaire de la valeur des biens immobiliers dans la zone qu'elle couvre. En un mois, elle exécute des prédictions pendant quatre semaines, par lots de 3920
, 4277
, 3849
et 3961
. Les tâches sont traitées par un seul nœud, et chaque instance nécessite en moyenne 0.72
seconde de traitement.
Commencez par calculer la durée d'exécution de chaque tâche :
3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes 4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes 3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes 3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes
L'exécution de chaque tâche a duré plus de 10 minutes, et sera donc facturée à la minute de traitement.
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
Le coût total s'élève à 0,26 $ pour le mois.
Dans cet exemple, nous avons supposé que les tâches s'exécutaient sur un seul nœud et prenaient le même temps pour chaque instance d'entrée. En utilisation réelle, veillez à prendre en compte plusieurs nœuds et à utiliser le temps d'exécution effectif de chacun d'eux dans vos calculs.
Remarque sur les frais d'AI Platform Prediction pour AI Explanations
AI Explanations est disponible sans frais supplémentaires sur AI Platform Prediction. Cependant, le traitement des explications est plus long que celui des prédictions standards. L'utilisation intensive d'AI Explanations avec l'autoscaling peut donc entraîner le démarrage de davantage de nœuds, et ainsi augmenter vos frais sur AI Platform Prediction.
Utilisation obligatoire de Cloud Storage
En plus des coûts décrits dans ce document, vous devez stocker vos données et vos fichiers de programme dans des buckets Cloud Storage pendant le cycle de vie d'AI Platform Prediction. Ce stockage est soumis aux règles de tarification de Cloud Storage.
L'utilisation obligatoire de Cloud Storage comprend ce qui suit :
Préproduction de vos fichiers de modèle lorsque vous êtes prêt à déployer une version de modèle
Stockage de vos données d'entrée pour la prédiction par lot
Stockage des résultats de vos tâches de prédiction par lot (le stockage à long terme de ces éléments dans AI Platform Prediction n'est pas nécessaire ; vous pouvez supprimer les fichiers dès que l'opération est terminée)
Opérations gratuites pour la gestion de vos ressources
Les opérations de gestion des ressources proposées par AI Platform Prediction sont disponibles gratuitement. Toutefois, les règles de quotas d'AI Platform Prediction limitent certaines de ces opérations.
Ressource | Opérations gratuites |
---|---|
modèles | create, get, list et delete |
versions | create, get, list, delete et setDefault |
tâches | get, list et cancel |
opérations | get, list, cancel et delete |