Configurer l'environnement Cloud TPU
Avant de pouvoir utiliser les ressources Cloud TPU pour entraîner ou exécuter des inférences sur des modèles, vous devez effectuer les étapes de configuration suivantes:
- Configurer votre projet Google Cloud
- Configurer votre environnement pour utiliser Cloud TPU
- Préparer la demande de Cloud TPU
Configurer un projet Google Cloud
Vous devez disposer d'un compte et d'un projet Google Cloud pour utiliser Cloud TPU.
Dans la console Google Cloud, connectez-vous à votre compte Google ou créez un compte.
Installez Google Cloud CLI. La Google Cloud CLI est une interface qui permet d'accéder aux ressources et aux services Google Cloud, et de les gérer.
Sélectionnez ou créez un projet Google Cloud:
Dans la console Google Cloud, sélectionnez ou créez un projet Cloud à partir du sélecteur de projet.
Dans Cloud Shell, définissez votre ID de projet à l'aide de gcloud CLI. L'ID de projet est le nom de votre projet affiché dans la console Google Cloud.
$ gcloud config set project PROJECT-ID
Vérifiez que la facturation est activée pour votre projet Google Cloud.
La configuration de la facturation est requise pour toute utilisation de Google Cloud. Vous ne serez facturé qu'après avoir commencé à utiliser les ressources Google Cloud. Pour en savoir plus, consultez la documentation sur Cloud Billing.
La facturation de toutes les versions de Cloud TPU suit les tarifs régionaux standards indiqués sur la page des tarifs de Cloud TPU.
Configurer votre environnement pour utiliser Cloud TPU
Avant de demander un Cloud TPU, vous devez activer l'API Cloud TPU et vous assurer que vous disposez des autorisations nécessaires pour gérer les accès dans votre projet et créer une ressource Cloud TPU. Il est également recommandé de créer un compte de service géré par l'utilisateur à associer à votre TPU.
Activez l'API Cloud TPU à partir de la console Google Cloud ou à l'aide de gcloud CLI dans Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- Dans la console Google Cloud, accédez à la page de l'API Cloud TPU.
Accéder à la page de l'API Cloud TPU
- Cliquez sur Activer.
Assurez-vous de disposer des rôles suivants sur votre projet:
- Administrateur de compte de service: nécessaire pour créer un compte de service
- Administrateur IAM de projet: nécessaire pour attribuer un rôle dans un projet
- TPU Admin: nécessaire pour créer un TPU
Suivez les instructions de la section Afficher l'accès actuel pour savoir qui a accès à votre projet, dossier ou organisation. Pour afficher votre propre accès, dans la colonne Principal, recherchez la ligne contenant votre adresse e-mail. Si votre adresse e-mail ne figure pas dans cette colonne, vous n'avez aucun rôle. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez si la liste des rôles inclut les rôles requis.
Si vous ne disposez pas d'un rôle requis, accordez-le ou demandez à un administrateur de le faire.
Créez un agent de service Cloud TPU:
Les agents de service, un type d'identité de service, sont des identités de service gérées par Google qui permettent au service Cloud TPU d'effectuer des opérations dans votre projet Google Cloud. Par exemple, il permet de créer et de gérer des ressources Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
Créez un compte de service TPU:
Les comptes de service servent d'identifiants pour vos VM TPU. Les rôles associés à un compte de service accordent l'accès aux ressources Google Cloud. Nous vous recommandons d'utiliser un compte de service géré par l'utilisateur, en n'accordant que les autorisations requises par votre VM TPU. Si vous utilisez un compte de service géré par l'utilisateur, vous devez le spécifier lors de la création d'une VM TPU à l'aide de l'option
--service-account
.Suivez les instructions de la section Créer des comptes de service pour créer un compte de service géré par l'utilisateur.
Suivez les instructions de la section Gérer l'accès aux projets, aux dossiers et aux organisations pour autoriser votre compte de service à accéder aux services Google Cloud auxquels votre TPU aura accès. Les rôles suivants sont recommandés pour que votre TPU puisse accéder aux services Google Cloud couramment utilisés.
- TPU Admin: nécessaire pour bénéficier d'un accès complet aux ressources TPU
- Administrateur Storage: nécessaire pour accéder à Cloud Storage
- Rédacteur de journaux: nécessaire pour écrire des journaux avec l'API Logging.
- Rédacteur de métriques Monitoring: nécessaire pour écrire des métriques dans Cloud Monitoring.
Préparer la création d'un Cloud TPU
Avant de créer une ressource Cloud TPU, vous devez demander un quota. Vous devez également envisager d'utiliser des ressources en file d'attente, ainsi que les paramètres à utiliser pour configurer votre TPU.
Quota de requêtes:
Pour créer un Cloud TPU, votre projet Google Cloud doit disposer d'un quota pour la version et la taille de TPU que vous souhaitez créer, ainsi que pour la zone dans laquelle vous souhaitez le créer. Par exemple, si vous souhaitez créer un TPU v4-8 dans la région
us-central2-b
, vous devez demander un quota de 8 cœurs TPU v4 dans la régionus-central2-b
. Pour en savoir plus sur les zones dans lesquelles Cloud TPU est disponible, consultez la page Régions et zones TPU.Le quota est alloué différemment selon la version de TPU. Les attentes en termes de disponibilité varient selon les types de quotas. Pour en savoir plus sur l'allocation de quotas et les types de quotas, et pour savoir comment demander des quotas, consultez la page Quotas.
Déterminez si vous souhaitez utiliser des ressources en file d'attente.
Il est recommandé de créer un Cloud TPU en tant que ressource en file d'attente. Les ressources en file d'attente vous permettent de recevoir de la capacité dès qu'elles sont disponibles. Vous pouvez éventuellement spécifier des heures de début et de fin pour la réponse à la requête.
Différentes commandes de gcloud CLI permettent d'utiliser des ressources en file d'attente. Pour en savoir plus, consultez le Guide de l'utilisateur des ressources en file d'attente.
Déterminez les paramètres de création de Cloud TPU:
Zone: définissez l'option
--zone
sur la zone dans laquelle vous souhaitez créer un TPU. Vous devez disposer d'un quota dans cette zone. Pour en savoir plus, consultez la section Régions et zones TPU.Configuration TPU: si vous n'avez pas besoin de spécifier une topologie personnalisée, ou si vous utilisez un TPU v2 ou v3, définissez l'option
--accelerator-type
survVERSION-TENSORCORES
. Remplacez VERSION par le numéro de version de TPU que vous souhaitez utiliser. Remplacez TENSORCORES par le nombre de TensorCores que vous souhaitez utiliser.Si vous souhaitez personnaliser la topologie physique de votre TPU, utilisez les options
--version
et--topology
. Définissez l'option--version
sur la version de TPU que vous souhaitez utiliser. Définissez l'option--topology
sur la topologie que vous souhaitez utiliser.Pour en savoir plus sur les configurations TPU, y compris les configurations compatibles et les variantes de topologie, consultez la section Versions de TPU.
Version logicielle: si vous demandez une ressource en file d'attente, définissez l'option
--runtime-version
sur le nom de la version logicielle que vous souhaitez utiliser. Sinon, utilisez l'option--version
. Des versions logicielles TPU sont disponibles pour les frameworks TensorFlow, PyTorch et JAX. Pour en savoir plus sur les versions logicielles compatibles, consultez la section Versions du logiciel des VM TPU.Compte de service: définissez
--service-account
sur l'adresse e-mail d'un compte de service, le cas échéant, pour l'associer à votre TPU. Si ce champ est vide, le compte de service Compute Engine par défaut est utilisé.Type de quota : ajoutez l'option correspondant au type de quota que vous souhaitez utiliser.
Type de quota Option Réservées --reserved
VM Spot --spot
VM préemptive utilisant des ressources en file d'attente --best-effort
Instance préemptive qui n'utilise pas de ressources en file d'attente --preemptible
À la demande Aucune option supplémentaire nécessaire Configuration avancée: vous pouvez ajouter des options supplémentaires à votre requête pour configurer votre TPU. Pour en savoir plus, consultez la documentation
gcloud compute tpus tpu-vm create
et les sections suivantes de la page Gérer les TPU:
Pour obtenir des exemples de création d'un Cloud TPU, consultez la section Premiers pas.
Étapes suivantes
- Découvrez comment créer et gérer des ressources de VM et de TPU.
- Lancez un guide de démarrage rapide de Cloud TPU.