Tarifs de Cloud TPU

Les tarifs et les quotas appliqués aux TPU sont divisés en deux catégories :

  • Tarifs par type de TPU sur un seul appareil pour les appareils TPU disponibles à la demande ou en tant que TPU préemptifs. Il n'est pas possible de combiner plusieurs TPU sur un seul appareil en vue de collaborer sur une charge de travail unique.
  • Tarifs par type de pod TPU pour les clusters d'appareils TPU interconnectés sur des réseaux haut débit dédiés. Ces TPU ne sont disponibles que si vous disposez de quotas d'évaluation ou souscrivez un engagement sur un ou trois ans.

Les frais d'utilisation de Cloud TPU sont comptabilisés lorsque votre nœud TPU est à l'état READY. Une facture qui récapitule l'utilisation et les frais applicables est envoyée à la fin de chaque cycle de facturation.

Pour savoir comment demander un quota pour les TPU individuels, consultez la page Règles relatives aux quotas de Cloud TPU.

Tarifs pour un TPU individuel

L'utilisation de TPU individuels est facturée par tranches d'une seconde selon une tarification à la demande ou en tant que TPU préemptifs.

Les TPU individuels sont des appareils TPU indépendants sans connexions réseau directes à d'autres appareils TPU dans un centre de données Google. Si vos charges de travail nécessitent davantage de cœurs TPU et un pool de mémoire plus important, utilisez plutôt un type de pod TPU.

Un TPU préemptif peut être arrêté (préempté) par Cloud TPU à tout moment si ses ressources sont nécessaires pour une autre tâche. Les frais relatifs à un TPU préemptif sont beaucoup moins élevés que ceux d'un TPU normal. Les TPU préemptés dans la minute qui suit leur création ne vous sont pas facturés.

Vous pouvez configurer vos nœuds TPU avec ces types de TPU individuels :

Tarifs par type de pod TPU

Les pods TPU permettent d'accéder à plusieurs appareils TPU qui sont tous connectés à un réseau haut débit dédié. Ils offrent à un seul nœud TPU une plus grande capacité de calcul et un pool de mémoire TPU plus important. Pour utiliser des pods TPU, vous devez faire une demande de quota de l'une des façons suivantes :

  • Demandez l'accès aux quotas d'évaluation afin de pouvoir tester les performances des pods TPU. Les nœuds TPU que vous créez à l'aide des quotas d'évaluation sont facturés par tranches d'une seconde, mais n'offrent pas le même niveau de service que les appareils TPU à la demande ou que les appareils créés à l'aide des quotas d'engagement. Les quotas d'évaluation ne persistent que sur une durée limitée dans votre projet.
  • Souscrivez un engagement sur un ou trois ans et créez des nœuds TPU allant jusqu'à 2 048 cœurs. Les engagements ne sont pas facturés de manière incrémentielle. Les engagements permettent d'accéder aux cœurs réservés pour toutes les heures de la journée sur une base mensuelle continue pendant la durée du contrat. Des frais mensuels vous seront facturés pour la durée de votre période d'engagement, même si vous n'utilisez aucune ressource TPU.

Vous pouvez configurer vos nœuds TPU avec les types de TPU suivants :

Pour en savoir plus sur les différentes versions et configurations de TPU, consultez la documentation sur l'architecture du système Cloud TPU.

Coût total des engagements sur un an et sur trois ans

Le tableau ci-dessous indique le coût total des différents engagements TPU pendant toute la durée d'utilisation :

Pour demander l'accès à des TPU comportant plus de huit cœurs, veuillez contacter un conseiller commercial.

Programme TFRC (TensorFlow Research Cloud)

Si vous êtes inscrit au programme TFRC, vous pouvez accéder gratuitement à Cloud TPU v2 et v3 pendant une période limitée. Plus particulièrement, l'utilisation de Cloud TPU dans le cadre du programme TFRC ne vous est pas facturée tant que vous exécutez vos nœuds TPU dans la zone us-central1-f.

Tarifs pour les machines virtuelles

Pour vous connecter à un TPU, vous devez provisionner une machine virtuelle (VM), facturée séparément. Pour en savoir plus sur les tarifs des instances de VM, consultez la page sur les tarifs de Compute Engine.

Simulateur de coût

Pour obtenir une estimation du coût d'utilisation de Cloud TPU en association avec les instances de VM Compute Engine, accédez au simulateur de coût pour Compute Engine.

Exemple de tarification

L'exemple suivant vous indique comment calculer le coût total d'une tâche d'entraînement qui exploite des ressources TPU et des instances Compute Engine situées aux États-Unis.

Imaginez un chercheur en machine learning qui provisionne une machine virtuelle en créant une instance Compute Engine et qui choisit n1-standard-2 comme type de machine. Il crée ensuite une ressource TPU, et accumule 10 heures d'utilisation pour l'instance Compute Engine et la ressource TPU. Pour calculer le coût total d'une tâche d'entraînement, il doit additionner les éléments suivants :

  • Le coût total pour l'ensemble des instances Compute Engine
  • Le coût total pour l'ensemble des ressources Cloud TPU
Ressource Prix par machine et par heure (en USD) Nombre de machines Nombre d'heures facturées Coût total pour chaque ressource Coût total de la tâche d'entraînement
Instance
Compute Engine n1-standard-2
0,095 $ 1 10 0,95 $
Ressource Cloud TPU 4,50 $ 1 10 45,00 $
45,95 $

Exemple de tarification avec un TPU préemptif

Dans l'exemple suivant, nous utilisons les mêmes ressources et la même période que ci-dessus, mais nous partons du principe que le chercheur décide d'utiliser un TPU préemptif pour réaliser des économies. Aux États-Unis, un TPU v2 préemptif est facturé 1,35 $ par heure, contre 4,50 $ pour un TPU v2 classique.

Ressource Prix par machine et par heure (en USD) Nombre de machines Nombre d'heures facturées Coût total pour chaque ressource Coût total de la tâche d'entraînement
Instance
Compute Engine n1-standard-2
0,095 $ 1 10 0,95 $
TPU préemptif 1,35 $ 1 10 13,50 $
14,45 $

Étapes suivantes