Tarifs

AI Platform propose des tarifs souples et évolutifs, adaptés à votre projet et à votre budget. AI Platform facture l'entraînement de vos modèles et l'obtention de prédictions, mais la gestion de vos ressources de machine learning dans le cloud est gratuite.

Présentation de la tarification

Les tableaux suivants récapitulent les tarifs relatifs à l'entraînement et aux prédictions dans chaque région où AI Platform est disponible.

Tarifs relatifs à l'entraînement

Les tableaux suivants indiquent le coût par heure de plusieurs configurations relatives à l'entraînement, ainsi que le nombre d'unités d'entraînement2 utilisées dans le cadre de chaque configuration. Les unités d'entraînement permettent de mesurer l'utilisation des ressources pour votre tâche. Le coût par heure de la configuration d'une machine correspond au nombre d'unités d'entraînement multiplié par le tarif appliqué à l'entraînement dans la région concernée.

Vous pouvez choisir un niveau d'évolutivité prédéfini ou une configuration personnalisée pour les types de machines sélectionnés. Si vous optez pour une configuration personnalisée, vous devez additionner les coûts des machines virtuelles que vous utilisez.

Les tarifs des anciens types de machines utilisant des accélérateurs incluent les frais liés à ces derniers. Si vous utilisez des types de machines Compute Engine et que vous y associez des accélérateurs, les frais qui y sont liés sont distincts. Pour calculer ces frais, multipliez les tarifs indiqués dans le tableau sur les accélérateurs ci-dessous par le nombre d'accélérateurs de chaque type utilisés.

Amériques

Le coût d'une tâche d'entraînement dans toutes les régions disponibles des Amériques est de 0,49 $ de l'heure par unité d'entraînement.

Niveaux d'évolutivité prédéfinis – prix par heure (unités d'entraînement)
BASIC 0,1900 $ (0,3878)
STANDARD_1 1,9880 $ (4,0571)
PREMIUM_1 16,5536 $ (33,7829)
BASIC_GPU 0,8300 $ (1,6939)
BASIC_TPU 4,6900 $ (9,5714)
CUSTOM En sélectionnant le niveau d'évolutivité "CUSTOM" (PERSONNALISÉ), vous pouvez contrôler le nombre et le type de machines virtuelles utilisées pour votre tâche d'entraînement. Consultez le tableau des types de machines.
Types de machines – prix par heure (unités d'entraînement)
n1-standard-4 0,1900 $ (0,3878)
n1-standard-8 0,3800 $ (0,7755)
n1-standard-16 0,7600 $ (1,5510)
n1-standard-32 1,5200 $ (3,1020)
n1-standard-64 3,0400 $ (6,2041)
n1-standard-96 4,5600 $ (9,3061)
n1-highmem-2 0,1184 $ (0,2416)
n1-highmem-4 0,2368 $ (0,4833)
n1-highmem-8 0,4736 $ (0,9665)
n1-highmem-16 0,9472 $ (1,9331)
n1-highmem-32 1,8944 $ (3,8661)
n1-highmem-64 3,7888 $ (7,7322)
n1-highmem-96 5,6832 $ (11,5984)
n1-highcpu-16 0,5672 $ (1,1576)
n1-highcpu-32 1,1344 $ (2,3151)
n1-highcpu-64 2,2688 $ (4,6302)
n1-highcpu-96 3,4020 $ (6,9429)
cloud_tpu6 4,5000 $ (9,1840) ou N/A si des accélérateurs y sont explicitement associés6
standard 0,1900 $ (0,3878)
large_model 0,4736 $ (0,9665)
complex_model_s 0,2836 $ (0,5788)
complex_model_m 0,5672 $ (1,1576)
complex_model_l 1,1344 $ (2,3151)
standard_gpu 0,8300 $ (1,6939)
complex_model_m_gpu 2,5600 $ (5,2245)
complex_model_l_gpu 3,3200 $ (6,7755)
standard_p100 1,8400 $ (3,7551)
complex_model_m_p100 6,6000 $ (13,4694)
standard_v100 2,8600 $ (5,8367)
large_model_v100 2,9536 $ (6,0278)
complex_model_m_v100 10,6800 $ (21,7959)
complex_model_l_v100 21,3600 $ (43,5918)
Accélérateurs – prix par heure (unités d'entraînement)
NVIDIA_TESLA_K80 0,4500 $ (0,9184)
NVIDIA_TESLA_P4 0,6000 $ (1,2245)
NVIDIA_TESLA_P100 1,4600 $ (2,9796)
NVIDIA_TESLA_T4 0,9500 $ (1,9388)
NVIDIA_TESLA_V100 2,4800 $ (5,0612)
Huit cœurs TPU_V26 4,5000 $ (9,1840)
Huit cœurs TPU_V36 (version bêta) 8,0000 $ (16,3264)

Europe

Le coût d'une tâche d'entraînement dans toutes les régions disponibles d'Europe est de 0,54 $ de l'heure par unité d'entraînement.

Niveaux d'évolutivité prédéfinis – prix par heure (unités d'entraînement)
BASIC 0,2200 $ (0,4074)
STANDARD_1 2,3020 $ (4,2630)
PREMIUM_1 19,1640 $ (35,4889)
BASIC_GPU 0,9300 $ (1,7222)
BASIC_TPU (Non disponible)
CUSTOM En sélectionnant le niveau d'évolutivité "CUSTOM" (PERSONNALISÉ), vous pouvez contrôler le nombre et le type de machines virtuelles utilisées pour votre tâche d'entraînement. Consultez le tableau des types de machines.
Types de machines – prix par heure (unités d'entraînement)
n1-standard-4 0,2200 $ (0,4074)
n1-standard-8 0,4400 $ (0,8148)
n1-standard-16 0,8800 $ (1,6296)
n1-standard-32 1,7600 $ (3,2593)
n1-standard-64 3,5200 $ (6,5185)
n1-standard-96 5,2800 $ (9,7778)
n1-highmem-2 0,1370 $ (0,2537)
n1-highmem-4 0,2740 $ (0,5074)
n1-highmem-8 0,5480 $ (1,0148)
n1-highmem-16 1,0960 $ (2,0296)
n1-highmem-32 2,1920 $ (4,0593)
n1-highmem-64 4,3840 $ (8,1185)
n1-highmem-96 6,5760 $ (12,1778)
n1-highcpu-16 0,6568 $ (1,2163)
n1-highcpu-32 1,3136 $ (2,4326)
n1-highcpu-64 2,6272 $ (4,8652)
n1-highcpu-96 3,9408 $ (7,2978)
cloud_tpu6 (Non disponible)
standard 0,2200 $ (0,4074)
large_model 0,5480 $ (1,0148)
complex_model_s 0,3284 $ (0,6081)
complex_model_m 0,6568 $ (1,2163)
complex_model_l 1,3136 $ (2,4326)
standard_gpu 0,9300 $ (1,7222)
complex_model_m_gpu 2,8400 $ (5,2593)
complex_model_l_gpu 3,7200 $ (6,8889)
standard_p100 2,0400 $ (3,7778)
complex_model_m_p100 7,2800 $ (13,4815)
standard_v100 2,9684 $ (5,4970)
large_model_v100 3,0708 $ (5,6867)
complex_model_m_v100 11,0368 $ (20,4385)
complex_model_l_v100 22,0736 $ (40,8770)
Accélérateurs – prix par heure (unités d'entraînement)
NVIDIA_TESLA_K80 0,4900 $ (0,9074)
NVIDIA_TESLA_P4 0,6500 $ (1,2037)
NVIDIA_TESLA_P100 1,6000 $ (2,9630)
NVIDIA_TESLA_T4 1,0300 $ (1,9074)
NVIDIA_TESLA_V100 2,5500 $ (4,7222)
Huit cœurs TPU_V26 (Non disponible)
Huit cœurs TPU_V36 (version bêta) (Non disponible)

Asie-Pacifique

Le coût d'une tâche d'entraînement dans toutes les régions disponibles d'Asie-Pacifique est de 0,54 $ de l'heure par unité d'entraînement.

Niveaux d'évolutivité prédéfinis – prix par heure (unités d'entraînement)
BASIC 0,2200 $ (0,4074)
STANDARD_1 2,3020 $ (4,2630)
PREMIUM_1 19,1640 $ (35,4889)
BASIC_GPU 0,9300 $ (1,7222)
BASIC_TPU (Non disponible)
CUSTOM En sélectionnant le niveau d'évolutivité "CUSTOM" (PERSONNALISÉ), vous pouvez contrôler le nombre et le type de machines virtuelles utilisées pour votre tâche d'entraînement. Consultez le tableau des types de machines.
Types de machines – prix par heure (unités d'entraînement)
n1-standard-4 0,2200 $ (0,4074)
n1-standard-8 0,4400 $ (0,8148)
n1-standard-16 0,8800 $ (1,6296)
n1-standard-32 1,7600 $ (3,2593)
n1-standard-64 3,5200 $ (6,5185)
n1-standard-96 5,2800 $ (9,7778)
n1-highmem-2 0,1370 $ (0,2537)
n1-highmem-4 0,2740 $ (0,5074)
n1-highmem-8 0,5480 $ (1,0148)
n1-highmem-16 1,0960 $ (2,0296)
n1-highmem-32 2,1920 $ (4,0593)
n1-highmem-64 4,3840 $ (8,1185)
n1-highmem-96 6,5760 $ (12,1778)
n1-highcpu-16 0,6568 $ (1,2163)
n1-highcpu-32 1,3136 $ (2,4326)
n1-highcpu-64 2,6272 $ (4,8652)
n1-highcpu-96 3,9408 $ (7,2978)
cloud_tpu6 (Non disponible)
standard 0,2200 $ (0,4074)
large_model 0,5480 $ (1,0148)
complex_model_s 0,3284 $ (0,6081)
complex_model_m 0,6568 $ (1,2163)
complex_model_l 1,3136 $ (2,4326)
standard_gpu 0,9300 $ (1,7222)
complex_model_m_gpu 2,8400 $ (5,2593)
complex_model_l_gpu 3,7200 $ (6,8889)
standard_p100 2,0400 $ (3,7778)
complex_model_m_p100 7,2800 $ (13,4815)
standard_v100 2,9684 $ (5,4970)
large_model_v100 3,0708 $ (5,6867)
complex_model_m_v100 11,0368 $ (20,4385)
complex_model_l_v100 22,0736 $ (40,8770)
Accélérateurs – prix par heure (unités d'entraînement)
NVIDIA_TESLA_K80 0,4900 $ (0,9074)
NVIDIA_TESLA_P4 0,6500 $ (1,2037)
NVIDIA_TESLA_P100 1,6000 $ (2,9630)
NVIDIA_TESLA_T4 1,0300 $ (1,9074)
NVIDIA_TESLA_V100 2,5500 $ (4,7222)
Huit cœurs TPU_V26 (Non disponible)
Huit cœurs TPU_V36 (version bêta) (Non disponible)

Tarifs relatifs aux prédictions

Le tableau suivant indique le coût par heure de nœud des prédictions par lot et en ligne. Les heures de nœud correspondent au temps durant lequel une machine virtuelle exécute une tâche de prédiction ou durant lequel elle est disponible pour traiter les requêtes de prédiction. En savoir plus sur le calcul des coûts de prédiction

Amériques

Prédiction
Prédiction par lot 0,0791 $ par heure de nœud
Prédiction en ligne
Types de machines – prix par heure de nœud
mls1-c1-m2 (par défaut)

0,0401 $

mls1-c4-m2 (version bêta)

0,1349 $

n1-standard-2 (version bêta)

approximativement 0,0950 $

n1-standard-4 (version bêta)

approximativement 0,1900 $

n1-standard-8 (version bêta)

approximativement 0,3800 $

n1-standard-16 (version bêta)

approximativement 0,7600 $

n1-standard-32 (version bêta)

approximativement 1,5200 $

n1-highmem-2 (version bêta)

approximativement 0,1183 $

n1-highmem-4 (version bêta)

approximativement 0,2366 $

n1-highmem-8 (version bêta)

approximativement 0,4732 $

n1-highmem-16 (version bêta)

approximativement 0,9464 $

n1-highmem-32 (version bêta)

approximativement 1,8928 $

n1-highcpu-2 (version bêta)

approximativement 0,0708 $

n1-highcpu-4 (version bêta)

approximativement 0,1417 $

n1-highcpu-8 (version bêta)

approximativement 0,2834 $

n1-highcpu-16 (version bêta)

approximativement 0,5668 $

n1-highcpu-32 (version bêta)

approximativement 1,1336 $

Les types de machines Compute Engine (N1) (version bêta) sont disponibles uniquement dans la région us-central1 et sont facturés comme deux codes SKU distincts sur votre facture Google Cloud :

  • Coût du processeur virtuel, mesuré en heures de processeur virtuel
  • Coût de la mémoire RAM, mesurée en Go par heure

Les tarifs des types de machines Compute Engine (N1) indiqués dans le tableau précédent sont basés sur une approximation du coût horaire total pour chaque nœud de prédiction d'une version de modèle utilisant ce type de machine. Par exemple, étant donné qu'un type de machine n1-highcpu-32 inclut 32 processeurs virtuels et 28,8 Go de mémoire RAM, le tarif horaire par nœud est égal à 32 heures de processeur virtuel + 28,8 Go par heure.

Les tarifs indiqués dans le tableau précédent sont fournis pour vous aider à estimer vos coûts de prédiction. Le tableau suivant indique les coûts des processeurs virtuels et de la mémoire RAM pour les types de machines Compute Engine (N1), qui reflètent plus précisément les codes SKU qui vous seront facturés :

Codes SKU du type de machine Compute Engine (N1)
Processeur virtuel 0,031611 $ par heure de processeur virtuel
Mémoire RAM 0,004237 $ par Go/heure

Vous pouvez également utiliser des accélérateurs GPU pour la prédiction en ligne avec les types de machines Compute Engine (N1). Les GPU entraînent des frais supplémentaires en plus de ceux décrits dans le tableau précédent. Le tableau suivant indique les tarifs pour chaque type de GPU :

Accélérateurs – prix par heure
NVIDIA_TESLA_K80 0,4500 $
NVIDIA_TESLA_P4 0,6000 $
NVIDIA_TESLA_P100 1,4600 $
NVIDIA_TESLA_T4 0,9500 $
NVIDIA_TESLA_V100 2,4800 $

Veuillez noter que les tarifs sont indiqués par GPU. Aussi, si vous utilisez plusieurs GPU par nœud de prédiction (ou si votre version évolue pour utiliser plusieurs nœuds), les coûts évoluent en conséquence.

Europe

Prédiction
Prédiction par lot 0,0861 $ par heure de nœud
Prédiction en ligne
Types de machines – prix par heure de nœud
mls1-c1-m2 (par défaut)

0,0441 $

mls1-c4-m2 (version bêta)

0,1484 $

Asie-Pacifique

Prédiction
Prédiction par lot 0,0861 $ par heure de nœud
Prédiction en ligne
Types de machines – prix par heure de nœud
mls1-c1-m2 (par défaut)

0,0515 $

mls1-c4-m2 (version bêta)

0,1733 $

Remarques :

  1. Toute utilisation est soumise aux règles relatives aux quotas d'AI Platform.
  2. Veillez à bien noter la différence entre les unités d'entraînement mentionnées ici et les unités ML consommées indiquées sur la page Informations sur la tâche. En effet, la durée de la tâche est déjà prise en compte dans le calcul du nombre d'unités ML consommées. Consultez les détails ci-dessous.
  3. Vous devez stocker vos données et vos fichiers de programme dans des buckets Google Cloud Storage pendant le cycle de vie d'AI Platform. En savoir plus sur l'utilisation de Cloud Storage
  4. Pour les remises basées sur le volume, contactez l'équipe commerciale.
  5. Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU Cloud Platform s'appliquent.
  6. Le type de machine cloud_tpu fournit actuellement un appareil TPU v2 possédant 8 cœurs par défaut, même si aucun accélérateur n'est associé à la configuration. Dans ce cas, vous payez le prix indiqué pour cloud_tpu dans le tableau des types de machines.

    Si vous associez explicitement un accélérateur TPU v2 ou TPU v3 à un type de machine cloud_tpu dans votre configuration, vous n'êtes pas facturé pour le type de machine cloud_tpu lui-même. Vous payez alors pour les accélérateurs TPU_V2 ou TPU_V3 associés.

Simulateur de coût

Utilisez le Simulateur de coût afin d'obtenir l'estimation des frais liés à l'entraînement et aux prédictions.

Plus d'informations sur les frais d'entraînement

L'entraînement de vos modèles dans le cloud est facturé selon les règles suivantes :

  • Facturation par tranche d'une minute
  • Facturation au tarif horaire indiqué dans le tableau ci-dessus, où le tarif horaire est calculé selon un prix de base et un nombre d'unités d'entraînement, déterminé par la configuration de traitement que vous choisissez au début de votre tâche d'entraînement
  • Minimum de 10 minutes par tâche d'entraînement
  • Facturation à partir du moment où les ressources sont provisionnées pour une tâche et jusqu'à la fin de celle-ci

Niveaux d'évolutivité pour les configurations prédéfinies

Vous pouvez contrôler le type de cluster de traitement à utiliser pour l'entraînement de votre modèle. La méthode la plus simple consiste à choisir parmi l'une des configurations prédéfinies appelées niveaux d'évolutivité. En savoir plus sur les niveaux d'évolutivité.

Types de machines pour les configurations personnalisées

Si vous sélectionnez CUSTOM (PERSONNALISÉ) comme niveau d'évolutivité, c'est vous qui contrôlez le nombre et le type de machines virtuelles à utiliser pour le maître, le nœud de calcul et les serveurs de paramètres du cluster. En savoir plus sur les types de machines.

Le coût de l'entraînement avec un cluster de traitement personnalisé correspond à la somme de toutes les machines que vous indiquez. La durée totale de la tâche, et non le temps de traitement actif de chaque machine, vous est facturée.

Exemples : Calculer le coût de l'entraînement en utilisant les unités d'entraînement

La formule suivante permet de calculer le coût de votre tâche d'entraînement en utilisant les unités d'entraînement :

(training units * base price / 60) * job duration in minutes

Exemples :

  • Un data scientist résidant dans la région des Amériques exécute une tâche d'entraînement et sélectionne le niveau d'évolutivité STANDARD_1, qui utilise 4,0571 unités d'entraînement. La tâche dure 15 minutes :

    (4.0571 training units * $0.49 per hour / 60) * 15 minutes
    

    Le coût total de la tâche s'élève à 0,50 $.

  • Un professeur d'informatique résidant dans la région des Amériques exécute une tâche d'entraînement en utilisant le niveau d'évolutivité CUSTOM. Le modèle est très grand. Il souhaite donc tirer parti de machines virtuelles de grand modèle pour les serveurs de paramètres. Il configure son cluster de traitement de la manière suivante :

    • Une machine complex_model_s pour son maître (0,5788 unité d'entraînement).
    • Cinq serveurs de paramètres sur des VM large_model (5 @ 0,9665 = 4,8325 unités d'entraînement).
    • Huit nœuds de calcul sur des VM complex_model_s (8 @ 0,5788 = 4,6304 unités d'entraînement).

    La tâche dure 2 heures et 26 minutes :

    (10.0417 training units * $0.49 per hour / 60) * 146 minutes
    

    Le coût total de la tâche s'élève à 11,97 $.

Exemples : Calculer le coût de l'entraînement en utilisant le tarif horaire

Au lieu d'unités d'entraînement, vous pouvez utiliser le tarif horaire indiqué dans le tableau ci-dessus. La formule est la suivante :

(Price per hour / 60) * job duration in minutes

Exemples :

  • Un data scientist résidant dans la région des Amériques exécute une tâche d'entraînement et sélectionne le niveau d'évolutivité STANDARD_1. La tâche dure 15 minutes :

    ($1.9880 per hour / 60) * 15 minutes
    

    Le coût total de la tâche s'élève à 0,50 $.

  • Un professeur d'informatique résidant dans la région des Amériques exécute une tâche d'entraînement en utilisant le niveau d'évolutivité CUSTOM. Le modèle est très grand. Il souhaite donc tirer parti de machines virtuelles de grand modèle pour les serveurs de paramètres. Il configure son cluster de traitement de la manière suivante :

    • Une machine complex_model_s pour son maître (0,2836 $).
    • Cinq serveurs de paramètres sur des VM large_model (5 @ 0,4736 $ = 2,3680 $).
    • Huit nœuds de calcul sur des VM complex_model_s (8 @ 0,2836 $ = 2,2688 $).

    La tâche dure 2 heures et 26 minutes :

    (($0.2836 + $2.368 + $2.2688) per hour / 60) * 146 minutes
    

    Le coût total de la tâche s'élève à 11,97 $.

Exemples : Calculer le coût de l'entraînement en utilisant les "unités ML consommées"

Les unités ML consommées (unités de machine learning consommées) indiquées sur la page Informations sur la tâche correspondent aux unités d'entraînement pour la durée de la tâche prise en compte. Pour effectuer vos calculs avec des unités ML consommées, utilisez la formule suivante :

Consumed ML units * $0.49

Exemple :

  • Un data scientist résidant dans la région des Amériques exécute une tâche d'entraînement. La valeur 55,75 est indiquée dans le champ Unités ML consommées de la page Informations sur la tâche. Le calcul est le suivant :

    55.75 consumed ML units * $0.49
    

    Le coût total de la tâche s'élève à 27,32 $.

Pour accéder à la page Informations sur la tâche, consultez la Liste des tâches et cliquez sur le lien correspondant à la tâche concernée.

Plus d'informations sur les frais liés aux prédictions

AI Platform Prediction diffuse des prédictions à partir de votre modèle en exécutant plusieurs machines virtuelles ("nœuds"). Par défaut, AI Platform effectue le scaling automatique du nombre de nœuds en cours d'exécution à tout moment. Pour la prédiction en ligne, le nombre de nœuds s'adapte en fonction de la demande. Chaque nœud peut répondre à plusieurs requêtes de prédiction. Pour la prédiction par lot, le nombre de nœuds s'adapte afin de réduire la durée totale d'exécution de la tâche. Vous pouvez personnaliser le scaling des nœuds de prédiction.

Pour votre modèle, la durée d'exécution de chaque nœud vous est facturée, y compris dans les cas suivants :

  • Lorsque le nœud traite une tâche de prédiction par lot
  • Lorsque le nœud traite une requête de prédiction en ligne
  • Lorsque le nœud est disponible pour les prédictions en ligne

L'heure de nœud correspond au coût d'exécution d'un nœud durant une heure. Le tableau des tarifs relatifs aux prédictions indique le prix d'une heure de nœud, qui varie selon les régions et le type de prédiction (en ligne ou par lot).

Les heures de nœud peuvent être fractionnées afin d'être consommées par incréments. Par exemple, l'exécution d'un nœud durant 30 minutes coûte 0,5 heure de nœud. Toutefois, plusieurs règles régissent le calcul des coûts :

Calcul des coûts pour les anciens types de machines (MLS1) et la prédiction par lot

  • La durée d'exécution d'un nœud se mesure par incréments d'une minute et est arrondie à la minute supérieure. Par exemple, si un nœud s'exécute durant 20,1 minutes, son coût d'exécution sera calculé sur la base de 21 minutes.
  • Les durées d'exécution de nœud inférieures à 10 minutes sont arrondies à 10 minutes. Par exemple, si un nœud s'exécute durant 3 minutes seulement, son coût d'exécution sera calculé sur la base de 10 minutes.

Calcul des coûts pour les types de machines Compute Engine (N1)

  • La durée d'exécution d'un nœud est facturée par incrémentations de 30 secondes. Ainsi, toutes les 30 secondes, votre projet est facturé pour 30 secondes d'utilisation des processeurs virtuels, de la mémoire RAM et des ressources GPU alors utilisés par votre nœud.

Informations supplémentaires sur le scaling automatique des nœuds de prédiction

Prédiction en ligne Prédiction par lot
La priorité du scaling est de réduire la latence des requêtes individuelles. Le service permet à votre modèle de rester disponible pendant quelques minutes d'inactivité après le traitement d'une requête. La priorité du scaling est de réduire le temps total de la tâche.
Le scaling a un effet sur le montant total qui vous est facturé chaque mois : plus vos requêtes sont nombreuses et fréquentes, plus le volume de nœuds utilisés est important. Le scaling doit avoir peu d'effet sur le prix de votre tâche, même si la création d'un nœud engendre des frais.

Vous pouvez choisir de laisser le service s'adapter en fonction du trafic (scaling automatique) ou définir un nombre de nœuds à exécuter en permanence pour éviter la latence (scaling manuel).

  • Si vous sélectionnez le scaling automatique, le nombre de nœuds évolue automatiquement et peut être réduit à zéro pour les périodes sans trafic.
  • Si vous sélectionnez le scaling manuel, vous spécifiez un nombre de nœuds à exécuter en permanence. La totalité du temps d'exécution des nœuds vous est alors facturée, du déploiement jusqu'à la suppression de la version du modèle.
Vous pouvez modifier le scaling en définissant un nombre maximal de nœuds à utiliser pour une tâche de prédiction par lot et en définissant le nombre de nœuds à exécuter pour un modèle lorsque vous le déployez.

Coût minimal de 10 minutes

Souvenez-vous que si un nœud s'exécute pendant moins de 10 minutes, vous serez quand même facturé 10 minutes. Par exemple, supposons que vous utilisiez le scaling automatique. Durant une période sans trafic, aucun nœud n'est utilisé. La réception d'une seule requête de prédiction en ligne déclenche l'exécution d'un nœud pour traiter la requête. Après avoir traité la requête, le nœud continue de s'exécuter et reste disponible quelques minutes. Ensuite, il s'arrête. Même si le nœud a fonctionné moins de 10 minutes, son exécution vous est facturée 10 minutes de nœud (0,17 heure de nœud).

De même, si un nœud est ajouté pour traiter plusieurs requêtes de prédiction en ligne pendant 10 minutes avant de s'arrêter, vous serez facturé 10 minutes de nœud.

Vous pouvez utiliser le scaling manuel pour contrôler précisément le nombre de nœuds à exécuter durant une période donnée. Toutefois, si un nœud s'exécute pendant moins de 10 minutes, vous êtes quand même facturé 10 minutes.

En savoir plus sur la répartition et le scaling des nœuds

Exemple de calcul de frais liés aux prédictions

Une agence immobilière implantée dans la région des Amériques exécute une prédiction hebdomadaire de la valeur des biens immobiliers dans la zone qu'elle couvre. En un mois, elle exécute des prédictions pour quatre semaines par lot de 3920, 4277, 3849 et 3961. Les tâches sont traitées par un seul nœud, et chaque instance nécessite en moyenne 0.72 seconde de traitement.

Commencez par calculer la durée d'exécution de chaque tâche :

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

L'exécution de chaque tâche a duré plus de 10 minutes, et sera donc facturée à la minute de traitement.

($0.0791 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.06328
($0.0791 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.06855
($0.0791 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.06196
($0.0791 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.06328

Le coût total s'élève à 0,26 $ pour le mois.

Dans cet exemple, nous avons supposé que les tâches s'exécutaient sur un seul nœud et prenaient le même temps pour chaque instance d'entrée. En utilisation réelle, veillez à prendre en compte plusieurs nœuds et à utiliser le temps d'exécution effectif de chacun d'eux dans vos calculs.

Remarque sur les frais d'AI Platform Prediction pour AI Explanations

AI Explanations est disponible sans frais supplémentaires sur AI Platform Prediction. Cependant, Explanations prend plus de temps à traiter les données que des prédictions standards. L'utilisation intensive d'AI Explanations avec l'autoscaling peut donc entraîner le démarrage de plusieurs nœuds, et ainsi augmenter vos frais sur AI Platform Prediction.

Utilisation obligatoire de Cloud Storage

En plus des coûts décrits dans ce document, vous devez stocker vos données et vos fichiers de programme dans des buckets Cloud Storage pendant le cycle de vie d'AI Platform. Ce stockage est soumis aux règles de tarification de Cloud Storage.

L'utilisation obligatoire de Cloud Storage comprend ce qui suit :

  • Préproduction de votre package d'application d'entraînement

  • Stockage des données d'entrée d'entraînement

  • Préproduction de vos fichiers de modèle lorsque vous êtes prêt à déployer une version de modèle

  • Stockage de vos données d'entrée pour la prédiction par lot

  • Stockage des résultats de vos tâches de prédiction par lot (le stockage à long terme de ces éléments dans AI Platform n'est pas nécessaire ; vous pouvez supprimer les fichiers dès que l'opération est terminée)

  • Stockage des résultats de vos tâches d'entraînement (le stockage à long terme de ces éléments dans AI Platform n'est pas nécessaire ; vous pouvez supprimer les fichiers dès que l'opération est terminée)

Opérations gratuites pour la gestion de vos ressources

Les opérations de gestion des ressources proposées par AI Platform sont disponibles gratuitement. Les règles relatives aux quotas d'AI Platform limitent certaines de ces opérations.

Ressource Opérations gratuites
modèles create, get, list et delete
versions create, get, list, delete et setDefault
tâches get, list et cancel
opérations get, list, cancel et delete

Étapes suivantes