Configurer l'environnement Cloud TPU

Avant de pouvoir utiliser les ressources Cloud TPU pour entraîner ou exécuter des inférences sur des modèles, vous devez effectuer les étapes de configuration suivantes:

Configurer un projet Google Cloud

Vous devez disposer d'un compte et d'un projet Google Cloud pour utiliser Cloud TPU.

  1. Dans la console Google Cloud, connectez-vous à votre compte Google ou créez un compte.

  2. Installez Google Cloud CLI. Google Cloud CLI est une interface permettant d'accéder aux ressources et services Google Cloud et de les gérer.

  3. Sélectionnez ou créez un projet Google Cloud:

    Dans la console Google Cloud, sélectionnez ou créez un projet Cloud à l'aide du sélecteur de projet.

    Dans Cloud Shell, définissez votre ID de projet à l'aide de gcloud CLI. L'ID du projet est le nom de votre projet affiché dans la console Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Vérifiez que la facturation est activée pour votre projet Google Cloud.

    La configuration de la facturation est requise pour toute utilisation de Google Cloud. Vous ne serez facturé qu'une fois que vous aurez commencé à utiliser les ressources Google Cloud. Pour en savoir plus, consultez la documentation sur Cloud Billing.

    La facturation de l'utilisation de toutes les versions de Cloud TPU s'effectue selon la tarification régionale standard indiquée sur la page des tarifs de Cloud TPU.

Configurer votre environnement pour utiliser Cloud TPU

Avant de demander un Cloud TPU, vous devez activer l'API Cloud TPU et vous assurer que vous disposez des autorisations nécessaires pour gérer les accès dans votre projet et créer un Cloud TPU. Il est également recommandé de créer un compte de service géré par l'utilisateur à associer à votre TPU.

  1. Activez l'API Cloud TPU à partir de la console Google Cloud ou à l'aide de la gcloud CLI dans Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. Dans la console Google Cloud, accédez à la page de l'API Cloud TPU.

    Accéder à la page de l'API Cloud TPU

    1. Cliquez sur Activer.
  2. Assurez-vous que vous disposez des rôles suivants sur votre projet:

    Suivez les instructions de la section Afficher l'accès actuel pour voir qui a accès à votre projet, dossier ou organisation. Pour afficher votre propre accès, recherchez la ligne contenant votre adresse e-mail dans la colonne Compte principal. Si votre adresse e-mail ne figure pas dans cette colonne, cela signifie que vous n'avez aucun rôle. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez si la liste des rôles inclut les rôles requis.

    Si vous ne disposez pas d'un rôle requis, accordez-le ou demandez à un administrateur de le faire.

  3. Créez un compte de service TPU:

    Les comptes de service permettent au service Cloud TPU d'accéder à d'autres services Google Cloud. L'utilisation d'un compte de service géré par l'utilisateur est une pratique recommandée dans Google Cloud. associer un compte de service à votre TPU lorsque vous le créez à l'aide de l'option --service-account ;

    1. Suivez les instructions de la section Créer des comptes de service pour créer un compte de service.

    2. Suivez les instructions de la section Gérer l'accès aux projets, aux dossiers et aux organisations pour accorder à votre compte de service l'accès aux services Google Cloud auxquels votre TPU aura accès. Les rôles suivants sont recommandés pour que votre TPU puisse accéder aux services Google Cloud couramment utilisés.

Préparer la création d'un Cloud TPU

Avant de créer un Cloud TPU, vous devez demander un quota. Nous vous conseillons également d'utiliser des ressources en file d'attente, ainsi que les paramètres que vous souhaitez utiliser pour configurer votre TPU.

  1. Quota de requêtes:

    Pour que vous puissiez créer un Cloud TPU, votre projet Google Cloud doit disposer d'un quota correspondant à la version et à la taille du TPU que vous souhaitez créer, ainsi qu'à la zone dans laquelle vous souhaitez le créer. Par exemple, si vous souhaitez créer un TPU v4-8 dans la région us-central2-b, vous devez demander un quota de 8 cœurs de TPU v4 dans la région us-central2-b. Pour en savoir plus sur les zones dans lesquelles Cloud TPU est disponible, consultez la section Régions et zones des TPU.

    Les quotas sont alloués différemment selon la version de TPU. Les attentes en termes de disponibilité varient selon les types de quotas. Pour en savoir plus sur l'allocation et les types de quotas et sur la demande de quotas, consultez la section Quotas.

  2. Déterminez si vous souhaitez utiliser des ressources en file d'attente.

    La création d'un Cloud TPU en tant que ressource en file d'attente est une bonne pratique. Les ressources en file d'attente vous permettent de recevoir de la capacité dès qu'elle devient disponible. Vous pouvez éventuellement spécifier des heures de début et de fin pour le traitement de la requête.

    Différentes commandes de gcloud CLI permettent d'utiliser des ressources en file d'attente. Pour en savoir plus, consultez le Guide utilisateur des ressources en file d'attente.

  3. Déterminez les paramètres de création Cloud TPU:

    • Zone: définissez l'option --zone sur la zone dans laquelle vous souhaitez créer un TPU. Vous devez disposer d'un quota alloué dans cette zone. Pour en savoir plus, consultez la section Régions et zones des TPU.

    • Configuration TPU: si vous n'avez pas besoin de spécifier de topologie personnalisée, ou si vous utilisez TPU v2 ou v3, définissez l'option --accelerator-type sur vVERSION-TENSORCORES. Remplacez VERSION par le numéro de version de TPU que vous souhaitez utiliser. Remplacez TENSORCORES par le nombre de TensorCore que vous souhaitez utiliser.

      Si vous souhaitez personnaliser la topologie physique de votre TPU, utilisez les options --version et --topology. Définissez l'indicateur --version sur la version de TPU que vous souhaitez utiliser. Définissez l'option --topology sur la topologie que vous souhaitez utiliser.

      Pour en savoir plus sur les configurations de TPU, y compris les configurations et variantes de topologie compatibles, consultez la section Versions de TPU.

    • Version logicielle: si vous demandez une ressource en file d'attente, définissez l'option --runtime-version sur le nom de la version logicielle que vous souhaitez utiliser. Sinon, utilisez l'option --version. Des versions logicielles TPU sont disponibles pour les frameworks TensorFlow, PyTorch et JAX. Pour en savoir plus sur les versions logicielles compatibles, consultez la section Versions logicielles de VM TPU.

    • Compte de service: définissez --service-account sur l'adresse e-mail d'un compte de service, si vous en avez créé un, pour l'associer à votre TPU. Si ce champ est vide, le compte de service Compute Engine par défaut est utilisé.

    • Type de quota: si vous souhaitez créer un TPU à l'aide d'un quota réservé, ajoutez l'option --reserved à votre requête.

      Si vous souhaitez créer un TPU à l'aide d'un quota préemptif et que vous demandez une ressource en file d'attente, ajoutez l'option --best-effort à votre requête.

      Si vous souhaitez créer un TPU à l'aide d'un quota préemptif et que vous ne demandez pas de ressource en file d'attente, ajoutez l'option --preemptible à votre requête.

      Si vous souhaitez créer un TPU à l'aide d'un quota à la demande, vous n'avez pas besoin d'ajouter d'indicateurs supplémentaires.

    • Configuration avancée: vous pouvez ajouter des indicateurs supplémentaires à votre requête de configuration du TPU. Pour en savoir plus, consultez la documentation gcloud compute tpus tpu-vm create et les sections suivantes de la page Gérer les TPU:

Pour obtenir des exemples de création d'une ressource Cloud TPU, consultez la section Premiers pas.

Étapes suivantes

  1. Découvrez comment créer et gérer des ressources de VM et de TPU.
  2. Exécutez un guide de démarrage rapide pour Cloud TPU.