Gérer les TPU

Vous pouvez exécuter les commandes gcloud décrites dans ce document avec les deux configurations TPU : VM TPU et nœuds TPU. Les commandes gcloud que vous utilisez dépendent de la configuration TPU que vous utilisez. Chaque commande gcloud s'affiche dans une section à onglets. Choisissez l'onglet correspondant à la configuration TPU que vous souhaitez utiliser. La page Web affiche la commande gcloud appropriée. À moins que vous ayez besoin d'utiliser des nœuds TPU, nous vous recommandons d'utiliser des VM TPU. Pour en savoir plus sur les configurations de TPU, consultez la page Architecture du système.

L'exécution d'un modèle de machine learning (ML) nécessite une VM Compute Engine et des ressources Cloud TPU. Cette page explique comment gérer ces ressources à l'aide des outils suivants :

Prérequis

Pour exécuter ces procédures, vous devez configurer un projet Google Cloud Platform (GCP). Si vous n'avez pas de projet, consultez la section Créer et gérer des projets pour en créer un.

Si vous exécutez la commande gcloud, vous pouvez utiliser Google Cloud Shell ou installer la commande gcloud en local. Google Cloud Shell vous permet d'interagir avec les Cloud TPU sans avoir à installer de logiciel. Google Cloud Shell peut se déconnecter après une période d'inactivité. Par conséquent, si vous exécutez des commandes de longue durée, nous vous recommandons d'installer gcloud sur votre ordinateur local. La commande gcloud fait partie du SDK Google Cloud.

  1. Installez le SDK Google Cloud.
  2. Configurez gcloud pour utiliser votre projet.

    gcloud config set project project-name
    
  3. Configurez gcloud pour utiliser la zone dans laquelle vous prévoyez de créer vos ressources Cloud TPU. Exemple :us-central1-b

    $ gcloud config set compute/zone zone
    

Pour en savoir plus sur la commande gcloud, consultez la documentation de référence de gcloud.

Créer un Cloud TPU

Lorsque vous créez un Cloud TPU, vous créez une VM Compute Engine et des ressources TPU.

Créer un Cloud TPU avec gcloud

Si vous souhaitez utiliser Cloud Shell, cliquez sur Ouvrir Cloud Shell. Sinon, ouvrez une fenêtre d'invite de commande ou de terminal sur votre ordinateur local.

Créez vos ressources Cloud TPU. Les commandes à appliquer varient selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm create tpu-name \
  --zone=zone \
  --accelerator-type=v3-8 \
  --version=v2-alpha

Description des options de commande

zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

accelerator-type
Type du Cloud TPU à créer.

version
Version d'exécution de Cloud TPU. Les versions compatibles sont v2-alpha pour les TPU individuels et v2-alpha-pod pour les pods.

Nœuds TPU

$ gcloud compute tpus execution-groups create --name=tpu-name \
  --zone=zone \
  --tf-version=2.4.1 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8

Description des options de commande

zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

tf-version
Version de Tensorflow que la commande gcloud installe sur votre VM.

machine-type
Type de machine de la VM Compute Engine à créer.

accelerator-type
Type du Cloud TPU à créer.

Créer un Cloud TPU dans Google Cloud Console

  1. Accédez à Google Cloud Console.
  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU.
  3. Cliquez sur CRÉER UN NŒUD TPU.
  4. Dans le champ Nom, saisissez un nom d'instance TPU.
  5. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
  6. Sous Configuration du TPU, sélectionnez VM TPU ou Nœud TPU. La configuration du TPU détermine si vous créez le TPU en tant que VM TPU ou en tant que nœud TPU. Pour en savoir plus, consultez la page Architecture du système.
  7. Dans le champ Type de TPU, sélectionnez le type de TPU que vous souhaitez créer.
  8. Dans le champ Version logicielle du TPU, sélectionnez la version du logiciel. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Lors de la création d'un nœud Cloud TPU, la version logicielle TPU vous permet de choisir le framework de ML installé sur la VM du nœud. Aucun autre paramètre n'est requis. Pour en savoir plus, consultez la page Modèles compatibles.
  9. Cliquez sur CRÉER pour créer vos ressources.

Se connecter à une VM Cloud TPU

Par défaut, la commande gcloud que vous utilisez pour créer des nœuds TPU tente automatiquement de se connecter en SSH à votre nœud TPU. Si vous utilisez des nœuds TPU et que vous n'êtes pas connecté à l'instance Compute Engine par la commande gcloud compute tpus execution-groups, vous pouvez vous connecter en exécutant la commande de nœuds TPU suivante. Si vous utilisez des VM TPU, vous devez explicitement vous connecter en SSH à votre TPU à l'aide de la commande de VM TPU suivante.

VM TPU

$ gcloud compute tpus tpu-vm ssh tpu-name \
  --zone=zone

Nœuds TPU

$ gcloud compute ssh tpu-name\
  --zone=zone

Répertorier les ressources Cloud TPU

Vous pouvez répertorier tous vos Cloud TPU dans une zone spécifiée.

Répertorier les ressources Cloud TPU à l'aide de gcloud

Les commandes à appliquer varient selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm list --zone=zone

Nœuds TPU

$ gcloud compute tpus execution-groups list --zone=zone

Cette commande répertorie les ressources Cloud TPU dans la zone spécifiée. Si aucune ressource n'est actuellement configurée, la sortie n'affiche que des tirets pour la VM et le TPU. Si une ressource est active et que l'autre ne l'est pas, un message indiquant que l'état n'est pas opérationnel s'affiche. Vous devez démarrer ou redémarrer la ressource inactive.

Répertorier les ressources Cloud TPU à l'aide de la console GCP

  1. Accédez à Google Cloud Console.

  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU. La console affiche la page "TPU".

Récupérer des informations sur un Cloud TPU

Vous pouvez récupérer des informations sur un Cloud TPU spécifié.

Récupérer des informations sur un Cloud TPU à l'aide de gcloud

Les commandes à appliquer varient selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm describe tpu-name \
  --zone=zone

Nœuds TPU

$ gcloud compute tpus execution-groups describe tpu-name \
  --zone=zone

Récupérer des informations sur un Cloud TPU à l'aide de Google Cloud Console

  1. Accédez à Google Cloud Console.
  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU. La console affiche la page "TPU".
  3. Cliquez sur le nom de votre Cloud TPU. La page d'informations Cloud TPU s'affiche.

Arrêter vos ressources Cloud TPU

Vous pouvez arrêter un seul Cloud TPU pour ne plus encourir de frais sans perdre la configuration et les logiciels de votre VM. Il n'est pas possible d'arrêter les pods TPU.

Arrêter un Cloud TPU avec gcloud

La commande à utiliser pour arrêter un Cloud TPU varie selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm stop tpu-name \
--zone=zone

Nœuds TPU

$ gcloud alpha compute tpus stop tpu-name \
--zone=zone

Arrêter un Cloud TPU dans la console GCP

  1. Accédez à Google Cloud Console.

  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU. La console affiche la page "TPU".

  3. Cochez la case située à côté de votre Cloud TPU, puis cliquez sur Arrêter.

Démarrer des ressources Cloud TPU

Vous pouvez démarrer un Cloud TPU lorsqu'il est arrêté.

Démarrer un Cloud TPU avec gcloud

La commande à utiliser pour arrêter un Cloud TPU varie selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm start tpu-name --zone=zone

Nœuds TPU

$ gcloud alpha compute tpus start tpu-name --zone=zone

Démarrer un Cloud TPU dans la console GCP

  1. Accédez à Google Cloud Console.

  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU. La console affiche la page "TPU".

  3. Cochez la case située à côté de votre Cloud TPU, puis cliquez sur Démarrer.

Supprimer la VM Compute Engine et vos ressources Cloud TPU

Vous pouvez supprimer votre Cloud TPU lorsque vous avez fini de l'utiliser.

Supprimer un Cloud TPU à l'aide de gcloud

La commande à utiliser varie selon que vous utilisez des VM TPU ou des nœuds TPU. Pour en savoir plus, consultez la page Architecture du système.

VM TPU

$ gcloud compute tpus tpu-vm delete tpu-name \
  --zone=zone

Description des options de commande

zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Nœuds TPU

$ gcloud compute tpus execution-groups delete tpu-name \
  --zone=zone

Description des options de commande

zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Supprimer un Cloud TPU à l'aide de la console GCP

  1. Accédez à Google Cloud Console.

  2. Dans le menu de navigation, sélectionnez Compute Engine > TPU. La console affiche la page "TPU".

  3. Cochez la case située à côté de votre Cloud TPU, puis cliquez sur Supprimer.