TPU préemptifs

Les TPU préemptifs coûtent beaucoup moins cher que les TPU non préemptifs. Le service Cloud TPU peut préempter (ou arrêter) ces TPU à tout moment si des ressources TPU supplémentaires sont nécessaires.

Créer une VM TPU préemptive

gcloud

$ gcloud compute tpus tpu-vm create demo-tpu \
  --zone=europe-west4-a \
  --accelerator-type=v3-8 \
  --version=tpu-vm-tf-2.17.0-pjrt \
  --preemptible
  

où :

  • demo-tpu correspond au nom du TPU.
  • accelerator-type est le type de TPU. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
  • version est l'image de la VM Cloud TPU à installer.
  • preemptible permet à Cloud TPU de préempter le TPU.

Prix et quota applicables aux TPU préemptifs

Le prix des TPU préemptifs est nettement inférieur à celui des TPU normaux. Pour en savoir plus, consultez la page des tarifs. Les TPU préemptés dans la minute qui suit leur création ne vous sont pas facturés.

Le quota applicable aux TPU préemptifs est généralement plus élevé et est distinct du quota applicable aux TPU normaux. Consultez la page de quota.

Détecter si un TPU a été préempté

Utilisez la commande gcloud suivante pour vérifier si Le service Cloud TPU a préempté votre TPU:

Répertoriez les TPU disponibles :

gcloud compute tpus tpu-vm list
  --zone=us-central1-b
  

La sortie de la commande affiche les détails des TPU créés dans votre projet. Si le TPU a été préempté, l'état passe de READY à PREEMPTED.

Exemple :

NAME       ZONE           ACCELERATOR_TYPE  NETWORK_ENDPOINT   NETWORK  RANGE          STATUS
demo-tpu   us-central1-b  v2-8              10.240.1.2:8470    default  10.240.1.0/29  PREEMPTED

Concevoir votre application de machine learning pour qu'elle s'exécute sur des TPU préemptifs

Vous devez vous assurer que votre application est résiliente à tout redémarrage de la VM et du TPU. Pour cela, enregistrez régulièrement des points de contrôle pour le modèle et configurez votre application pour qu'elle restaure le dernier point de contrôle en cas de redémarrage.