Gérer les ressources en file d'attente
Les ressources en file d'attente vous permettent de demander des ressources Cloud TPU via une file d'attente. Lorsque vous demandez des ressources en mode file d'attente, la demande est ajoutée à une file d'attente gérée par le service Cloud TPU. Lorsque la ressource demandée est disponible, elle est attribuée à votre projet Google Cloud pour votre utilisation exclusive et immédiate. Il restera attribué à votre projet, sauf si vous le supprimez ou si un autre projet le préempte. Seules les VM Spot TPU et les TPU préemptifs peuvent être préemptées.
Vous pouvez spécifier une heure de début et de fin facultative dans une requête de ressources mise en file d'attente. L'heure de début spécifie l'heure la plus proche à laquelle la requête doit être traitée. Si une demande n'a pas été traitée avant l'heure de fin spécifiée, elle expire. La requête reste dans la file d'attente après avoir expiré.
Les requêtes de ressources mises en file d'attente peuvent avoir l'un des états suivants:
WAITING_FOR_RESOURCES
- La requête a passé la validation initiale et a été ajoutée à la file d'attente. Il reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources libres pour commencer à provisionner votre requête ou jusqu'à ce que l'intervalle d'allocation expire. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être provisionnées immédiatement. Si vous avez besoin d'une disponibilité plus fiable des TPU, envisagez d'acheter une réservation.
PROVISIONING
- La requête a été sélectionnée dans la file d'attente et ses ressources sont en cours d'allocation.
ACTIVE
- La requête a été allouée. Lorsque les requêtes de ressources en file d'attente sont à l'état
ACTIVE
, vous pouvez gérer vos VM TPU comme décrit dans la section Gérer les TPU. FAILED
- La requête n'a pas pu être traitée, soit en raison d'un problème avec la requête, soit parce que les ressources demandées n'étaient pas disponibles dans l'intervalle d'allocation. La requête reste dans la file d'attente jusqu'à ce qu'elle soit supprimée explicitement.
SUSPENDING
- Les ressources associées à la requête sont en cours de suppression.
SUSPENDED
- Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une requête est à l'état
SUSPENDED
, elle n'est plus éligible à une nouvelle allocation.
Prérequis
Avant d'exécuter les commandes de ce guide, vous devez installer Google Cloud CLI, créer un projet Google Cloud et activer l'API Cloud TPU. Pour obtenir des instructions, consultez la section Configurer l'environnement Cloud TPU.
Demander une ressource en file d'attente à la demande
Les ressources à la demande ne seront pas préemptées, mais le quota à la demande ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre demande. Pour en savoir plus sur les ressources à la demande, consultez la section Types de quotas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
Tailles de tranche par défaut pour les ressources mises en file d'attente à la demande
Lorsque vous utilisez un quota à la demande, vous devez demander une taille de tranche inférieure à la limite par défaut pour le type d'accélérateur que vous utilisez. Les requêtes qui dépassent les limites par défaut sont refusées par le système.
Le tableau suivant présente les types de TPU et les limites par défaut associées.
Type d'accélérateur | Limite par défaut (en nombre de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si vous avez besoin de tailles de tranche plus importantes, contactez l'assistance Cloud TPU pour en savoir plus.
Demander une ressource en file d'attente à l'aide d'une réservation
Vous pouvez demander une ressource en file d'attente à l'aide d'une réservation. Pour acheter une réservation, contactez l'équipe chargée de votre compte Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --reserved
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Développez la section Gestion.
Cochez la case Utiliser une réservation existante.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
Demander une ressource en file d'attente pour une VM Spot TPU
Une VM Spot est une ressource qui peut être préemptée et attribuée à une autre charge de travail à tout moment. Les ressources des VM Spot coûtent moins cher, et vous pouvez y accéder plus rapidement qu'avec une demande de VM non Spot. Pour en savoir plus sur les VM Spot TPU, consultez Gérer les VM Spot TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
spot
- Indicateur booléen indiquant que la ressource mise en file d'attente est une VM spot.
Demander l'allocation d'une ressource mise en file d'attente avant ou après une heure spécifiée
Vous pouvez spécifier une heure de début ou une heure de fin facultative dans une requête de ressources mise en file d'attente. L'heure de début ou la durée de début spécifie l'heure la plus précoce à laquelle la requête doit être traitée. L'heure de fin ou la durée de fin spécifient la durée pendant laquelle la requête reste valide. Si une demande n'a pas été satisfaite avant la date de fin ou la durée spécifiées, elle expire. Une fois la requête expirée, elle reste dans la file d'attente, mais ne peut plus être allouée.
Vous pouvez également spécifier un intervalle d'allocation en spécifiant une heure de début ou une durée, ainsi qu'une heure de fin ou une durée.
Pour obtenir la liste des formats d'horodatage et de durée acceptés, consultez la section Date/Heure.
Demander qu'une ressource mise en file d'attente soit traitée après un délai spécifié
Dans une requête de ressource mise en file d'attente, vous pouvez spécifier une heure ou une durée après laquelle une ressource doit être allouée.
gcloud
La commande suivante demande un TPU v4-4096 à allouer après 9h le 14 décembre 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Heure à partir de laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez Date et heure de la discussion Google Cloud CLI.
curl
La commande suivante demande un TPU v4-4096 à allouer après 9h le 14 décembre 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Heure à partir de laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez Date et heure de la discussion Google Cloud CLI.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Dans le champ Début de la requête, saisissez l'heure à partir de laquelle la ressource doit être allouée.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
L'exemple suivant demande l'allocation d'un v4-32 au bout de six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-duration
- Durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez Date et heure de l'objet Google Cloud CLI
Demander une ressource mise en file d'attente qui expire après un délai spécifié
Dans une requête de ressources mise en file d'attente, vous pouvez spécifier la durée pendant laquelle une requête de ressources mise en file d'attente reste valide. Si la requête n'a pas été traitée avant l'heure ou la durée que vous spécifiez, elle expire.
gcloud
La commande suivante demande un TPU v4-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h, elle expirera.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
curl
La commande suivante demande un TPU v4-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h, elle expirera.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Dans le champ Cancel request on (Annuler la requête à partir de), saisissez l'heure à laquelle la requête de ressource mise en file d'attente doit expirer si elle n'est pas remplie.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
L'exemple suivant demande une version v4-32. La demande expire si elle n'est pas traitée dans un délai de six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'objet Google Cloud CLI
Demander l'allocation d'une ressource mise en file d'attente dans un intervalle spécifié
Vous pouvez spécifier un intervalle d'allocation en indiquant à la fois l'heure de début ou la durée, ainsi que l'heure de fin ou la durée.
gcloud
La commande suivante demande une version 4-32 dans cinq heures et 30 minutes à compter de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-timw
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
curl
La commande suivante demande une version 4-32 dans cinq heures et 30 minutes à compter de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-timw
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Dans le champ Début de la requête, saisissez l'heure à partir de laquelle la ressource doit être allouée.
Dans le champ Cancel request on (Annuler la requête à partir de), saisissez l'heure à laquelle la requête de ressource mise en file d'attente doit expirer si elle n'est pas remplie.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
Demander une ressource mise en file d'attente avec un script de démarrage
Vous pouvez spécifier un script à exécuter sur une ressource mise en file d'attente après son provisionnement.
gcloud
Lorsque vous utilisez la commande gcloud
, vous pouvez utiliser l'option --metadata
ou --metadata-from-file
pour spécifier respectivement une commande de script ou un fichier contenant le code de script. L'exemple suivant crée une requête de ressource mise en file d'attente qui exécutera le script startup-script.sh
.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Durée de validité de la requête, après quoi elle est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la discussion Google Cloud CLI.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande part du principe qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui s'exécute lorsque la ressource mise en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.
curl
Lorsque vous utilisez curl
, vous devez inclure le code du script dans le contenu JSON.
L'exemple suivant inclut un script intégré dans le corps JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.18.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Durée de validité de la requête, après quoi elle est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la discussion Google Cloud CLI.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande part du principe qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui s'exécute lorsque la ressource mise en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.
Demander une ressource mise en file d'attente avec un réseau et un sous-réseau spécifiés
Dans une requête de ressources en file d'attente, vous pouvez spécifier un réseau et un sous-réseau auxquels vous souhaitez connecter votre TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.18.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- Réseau auquel la ressource mise en file d'attente appartient.
subnetwork
- Sous-réseau auquel la ressource mise en file d'attente fera partie.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.18.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- Réseau auquel la ressource mise en file d'attente appartient.
subnetwork
- Sous-réseau auquel la ressource mise en file d'attente fera partie.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.
Développez la section Réseau.
Dans les champs Réseau et Sous-réseau, sélectionnez le réseau et le sous-réseau que vous souhaitez utiliser.
Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.
Supprimer une requête de ressource en file d'attente
Vous pouvez supprimer une requête de ressource en file d'attente et le TPU associé à la requête en supprimant la requête de ressource en file d'attente:
gcloud
Transmettez l'option --force
à la commande queued-resource delete
:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project my-project \ --zone us-central2-b \ --force \ --async
Description des options de commande
your-queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.
curl
Utilisez le paramètre de requête force=true
dans votre requête curl
:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/your-queued-resource-id?force=true
Description des options de commande
your-queued-resource-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur l'onglet Ressources en file d'attente.
Cochez la case à côté de votre demande de ressources mise en file d'attente.
Cliquez sur
Supprimer.
Si vous supprimez directement le TPU, vous devez également supprimer la ressource en file d'attente, comme illustré dans l'exemple suivant. Lorsque vous supprimez le TPU, la requête de ressource mise en file d'attente passe à l'état SUSPENDED
, après quoi elle peut être supprimée.
gcloud
Supprimez le TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project \ --zone=zone \ --quiet
Description des options de commande
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
your-node-id
- Nom du TPU que vous souhaitez supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
curl
Supprimez le TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central2-b/nodes?node_id=your-node-id
Description des options de commande
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
your-node-id
- Nom du TPU que vous souhaitez supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
Console
Supprimez votre TPU:
Dans la console Google Cloud, accédez à la page TPU:
Cochez la case située à côté de votre TPU.
Cliquez sur
Supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état En cours de suspension, puis à l'état Suspendu. Lorsque votre ressource en file d'attente est à l'état Suspendu, vous pouvez la supprimer:
- Cliquez sur l'onglet Ressources en file d'attente.
- Cochez la case à côté de votre demande de ressources mise en file d'attente.
- Cliquez sur Supprimer.
Récupérer l'état et les informations de diagnostic d'une requête de ressource mise en file d'attente
Récupérez l'état et les informations de diagnostic d'une requête de ressource mise en file d'attente:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur l'onglet Ressources en file d'attente.
Cliquez sur le nom de votre demande de ressources mise en file d'attente.
Une fois votre TPU provisionné, vous pouvez également consulter les détails de votre demande de ressources mise en file d'attente en accédant à la page TPU, en recherchant votre TPU, puis en cliquant sur le nom de la demande de ressources mise en file d'attente correspondante.
Si la requête échoue, la sortie contient des informations d'erreur. Pour une requête qui attend des ressources, le résultat ressemble à ceci:
gcloud
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Console
Le champ État de la ressource en file d'attente affiche En attente de ressources.
Lister les requêtes de ressources en file d'attente dans votre projet
Répertoriez les requêtes de ressources en file d'attente de votre projet:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
Description des options de commande
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Description des options de commande
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Console
Dans la console Google Cloud, accédez à la page TPU:
Cliquez sur l'onglet Ressources en file d'attente.