Configurer l'environnement Cloud TPU

Avant de pouvoir utiliser les ressources Cloud TPU pour entraîner ou exécuter des inférences sur des modèles, vous devez effectuer les étapes de configuration suivantes:

Configurer un projet Google Cloud

Vous devez disposer d'un compte et d'un projet Google Cloud pour utiliser Cloud TPU.

  1. Dans la console Google Cloud : connectez-vous à votre compte Google ; ou créer un compte.

  2. Installez Google Cloud CLI. La Google Cloud CLI est une pour accéder aux ressources et services Google Cloud, et les gérer.

  3. Sélectionnez ou créez un projet Google Cloud:

    Dans la console Google Cloud, sélectionnez ou créez un projet Cloud. dans le sélecteur de projet.

    Dans Cloud Shell, définissez votre ID de projet à l'aide de gcloud CLI. L'ID de projet est le nom de votre projet affiché dans la console Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Vérifiez que la facturation est activée pour votre projet Google Cloud.

    La configuration de la facturation est requise pour toute utilisation de Google Cloud. Vous serez uniquement facturé une fois que vous avez commencé à utiliser les ressources Google Cloud. Pour en savoir plus, consultez la documentation Cloud Billing.

    La facturation de toutes les versions de Cloud TPU suit les tarifs régionaux standards comme indiqué sur la page des tarifs de Cloud TPU.

Configurer votre environnement pour utiliser Cloud TPU

Avant de demander un Cloud TPU, vous devez activer l'API Cloud TPU et vérifiez que vous disposez des autorisations nécessaires pour gérer les accès dans votre projet et créer un Cloud TPU. Il est aussi recommandé de créer un service géré par l'utilisateur à rattacher à votre TPU.

  1. Activez l'API Cloud TPU depuis la console Google Cloud ou à l'aide du gcloud CLI dans Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. Dans la console Google Cloud, accédez à la page de l'API Cloud TPU.

    Accéder à la page de l'API Cloud TPU

    1. Cliquez sur Activer.
  2. Assurez-vous de disposer des rôles suivants sur votre projet:

    Suivez les instructions fournies dans l'article Afficher l'accès actuel pour afficher qui a accès à votre projet, dossier ou organisation. Pour afficher les vôtres dans la colonne Compte principal, recherchez la ligne contenant votre adresse e-mail. Si votre adresse e-mail ne figure pas dans cette colonne, vous n'avez aucun rôle. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez si le comprend les rôles requis.

    Si vous n'en avez pas, attribuer le rôle ou demandez à un administrateur de le faire.

  3. Créez un agent de service Cloud TPU:

    Les agents de service, qui sont un type d'identité de service, Identités de service gérées par Google utilisées par le service Cloud TPU pour effectuer des opérations dans votre projet Google Cloud. Par exemple, le service permet de créer et de gérer des ressources Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
    
  4. Créez un compte de service TPU:

    Les comptes de service servent d'identifiants pour vos VM TPU. Les rôles associés à un accordent l'accès aux ressources Google Cloud. Nous vous recommandons d'utiliser de service géré par l'utilisateur, n'accordant que les autorisations requises par votre VM TPU. Lorsque vous utilisez un compte de service géré par l'utilisateur, vous devez l'indiquer vous créez une VM TPU à l'aide de l'option --service-account.

    1. Suivez les instructions de la section Créer des comptes de service. pour créer un compte de service géré par l'utilisateur.

    2. Suivez les instructions de l'article Gérer l'accès aux projets, aux dossiers et aux organisations pour accorder à votre service aux services Google Cloud auxquels votre TPU aura accès. La les rôles suivants sont recommandés afin que votre TPU puisse accéder aux aux services Google Cloud.

Préparer la création d'un Cloud TPU

Avant de créer une ressource Cloud TPU, vous devez demander un quota. Vous devez également tenir compte à l'aide de ressources en file d'attente, ainsi que les paramètres à utiliser pour configurer votre TPU.

  1. Quota de requêtes:

    Pour que vous puissiez créer une ressource Cloud TPU, votre projet Google Cloud doit disposer d'un quota de la version et de la taille de TPU que vous souhaitez créer, ainsi que de la zone dans laquelle que vous voulez le créer. Par exemple, si vous souhaitez créer un TPU v4-8 dans us-central2-b, vous demanderiez un quota de 8 cœurs TPU v4 dans la région us-central2-b. Pour plus sur les zones où Cloud TPU est disponible, consultez la page Régions et zones TPU.

    Le quota est alloué différemment selon la version de TPU. Différents types de quota ont des attentes différentes en termes de disponibilité. Pour en savoir plus sur et les types de quotas, ainsi que la procédure à suivre pour demander des quotas, consultez la page Quotas.

  2. Déterminez si vous souhaitez utiliser des ressources en file d'attente.

    Il est recommandé de créer un Cloud TPU en tant que ressource en file d'attente. En file d'attente vous permettent de recevoir de la capacité dès qu'elle devient disponible. Vous pouvez spécifier des heures de début et de fin facultatives pour la réponse à la demande.

    La gcloud CLI permet d'utiliser différentes commandes ressources. Pour en savoir plus, consultez le Guide de l'utilisateur des ressources en file d'attente.

  3. Déterminez les paramètres de création de Cloud TPU:

    • Zone: définissez l'option --zone sur la zone dans laquelle vous souhaitez créer un TPU. Vous devez disposer d'un quota dans cette zone. Pour en savoir plus, consultez Régions et zones TPU.

    • Configuration TPU: si vous n'avez pas besoin de spécifier une topologie personnalisée, ou que vous utilisez TPU v2 ou v3, définissez l'option --accelerator-type sur vVERSION-TENSORCORES Remplacer VERSION par le numéro de version de TPU que vous souhaitez utiliser. Remplacer TENSORCORES par le nombre de TensorCores que vous souhaitez utiliser.

      Si vous souhaitez personnaliser la topologie physique de votre TPU, utilisez la classe Options --version et --topology. Définissez l'option --version sur le TPU. la version que vous souhaitez utiliser. Définissez l'option --topology sur la topologie que vous souhaitez utiliser.

      Pour en savoir plus sur les configurations TPU, y compris sur les configurations et ses variantes de topologie, consultez la section Versions de TPU.

    • Software version (Version logicielle) : si vous demandez une ressource en file d'attente, définissez le paramètre --runtime-version au nom de la version logicielle souhaitez utiliser. Sinon, utilisez l'option --version. Versions logicielles des TPU sont disponibles pour les frameworks TensorFlow, PyTorch et JAX. Pour plus d'informations sur les versions logicielles compatibles, consultez Versions logicielles des VM TPU.

    • Compte de service: définissez --service-account sur l'adresse e-mail d'un service. (si vous en avez créé un) pour l'associer à votre TPU. Si ce champ est vide, le compte de service Compute Engine par défaut sera utilisé.

    • Type de quota: ajoutez l'option correspondant au type de quota souhaité. à utiliser:

      Type de quota Option
      Réservées --reserved
      Spot VMs --spot
      VM préemptive utilisant des ressources en file d'attente --best-effort
      Instance préemptive qui n'utilise pas de ressources en file d'attente --preemptible
      À la demande Aucune option supplémentaire nécessaire
    • Configuration avancée: vous pouvez ajouter des options supplémentaires à votre requête pour configurer votre TPU. Consultez la documentation de gcloud compute tpus tpu-vm create. et les sections suivantes dans Gérer les TPU. pour en savoir plus:

Pour obtenir des exemples de création d'un Cloud TPU, consultez la section Premiers pas.

Étape suivante

  1. Découvrez comment créer et gérer des ressources de VM et de TPU.
  2. Lancez un guide de démarrage rapide de Cloud TPU.