Guide de l'utilisateur des ressources en file d'attente
Les ressources en file d'attente vous permettent de demander des ressources Cloud TPU en file d'attente. Lorsque vous demandez des ressources en mode file d'attente, la demande est ajoutée à une file d'attente gérée par le service Cloud TPU. Lorsque la ressource demandée devient disponible, attribuée à votre projet Google Cloud pour une utilisation exclusive immédiate. Il sera conservé attribué à votre projet, sauf si vous le supprimez ou s'il est préempté. Seules les VM Spot TPU et les TPU préemptifs peuvent être préemptées.
Vous pouvez spécifier une heures de début et de fin d'une file d'attente demande de ressource. L'heure de début indique l'heure la plus proche à laquelle la demande. Si une demande n'a pas été satisfaite avant l'heure de fin spécifiée, la propriété expire. La demande reste dans la file d'attente après son expiration.
Les requêtes de ressources en file d'attente peuvent présenter l'un des états suivants:
WAITING_FOR_RESOURCES
- La requête a réussi la validation initiale et a été ajoutée à la file d'attente. Il reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources libres pour commencer à provisionner votre requête ou jusqu'à l'expiration de l'intervalle d'allocation. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être immédiatement provisionnés. Si vous avez besoin d'une disponibilité plus fiable des TPU, envisagez d'acheter une réservation.
PROVISIONING
- La requête a été sélectionnée dans la file d'attente et ses ressources sont en cours d'allocation.
ACTIVE
- La demande a été attribuée. Lorsque des demandes de ressources en file d'attente se trouvent dans le
ACTIVE
, vous pouvez gérer vos VM TPU comme décrit dans Gérer les TPU FAILED
- La demande n'a pas pu être traitée, soit en raison d'un problème avec le ou que les ressources demandées n'étaient pas disponibles dans l'intervalle d'allocation. La requête reste dans la file d'attente jusqu'à ce qu'elle soit explicitement supprimée.
SUSPENDING
- Les ressources associées à la requête sont en cours de suppression.
SUSPENDED
- Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une requête est à l'état
SUSPENDED
, elle n'est plus éligible à une nouvelle allocation.
Prérequis
Avant d'exécuter les commandes de ce guide, assurez-vous de:
- installer les composants alpha de la Google Cloud CLI ;
- Activer l'API Cloud TPU
Demander une ressource en file d'attente à la demande
Vous pouvez demander une ressource en file d'attente à la demande à l'aide de la commande gcloud compute tpus queued-resources create
. Pour en savoir plus sur les ressources à la demande, consultez la section Types de quotas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
Tailles de tranche par défaut pour les ressources mises en file d'attente à la demande
Lorsque vous utilisez un quota à la demande, vous devez demander une taille de tranche inférieure à limite par défaut pour le type d'accélérateur utilisé. Les requêtes qui dépassent la les limites par défaut sont refusées par le système.
Le tableau suivant présente les types de TPU et les TPU les limites par défaut.
Type d'accélérateur | Limite par défaut (en nombre de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si vous avez besoin de tranches plus importantes, contactez Cloud TPU .
Demander une ressource en file d'attente à l'aide d'une réservation
Vous pouvez demander une ressource mise en file d'attente à l'aide d'une réservation en spécifiant l'option --reserved
dans votre commande gcloud
ou guaranteed.reserved=true
dans votre requête curl. Pour acheter une réservation, contactez l'équipe chargée de votre compte Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
Demander une ressource en file d'attente de VM TPU Spot
Une VM Spot est une ressource qui peut être préemptée et attribuées à une autre charge de travail à tout moment. Ressources de VM Spot moins onéreux, et vous pourriez avoir accès aux ressources plus tôt requête de VM non Spot. Pour en savoir plus sur les VM Spot TPU, consultez Gérer les VM Spot TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
spot
- Indicateur booléen spécifiant que la ressource en file d'attente est une VM Spot.
Demander l'allocation d'une ressource en file d'attente avant ou après un délai spécifié
Vous pouvez spécifier une heure de début, une heure de fin, une durée de début ou une durée de fin facultative dans une requête de ressources mise en file d'attente. La l'heure de début ou la durée de début indique l'heure de début la plus proche à laquelle doit requête. Si une demande n'a pas été satisfaite avant la date de fin ou la durée spécifiées, elle expire. Une fois la demande expirée, reste dans la file d'attente, mais ne peut plus être alloué.
Vous pouvez également spécifier un intervalle d'allocation : en spécifiant une heure de début ou une durée, et une heure de fin ou une durée.
Voir Datetime (Date/Heure) d'une liste des formats de code temporel et de durée acceptés.
Demander une ressource en file d'attente après une durée spécifiée
Vous pouvez spécifier la durée après laquelle une ressource doit être allouée à l'aide de la méthode
l'indicateur --valid-after-duration
. L'exemple suivant demande qu'un v4-32 soit alloué au bout de six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-duration
- Durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez Date et heure de la rubrique Google Cloud CLI.
Demander une ressource mise en file d'attente qui expire après une durée spécifiée
Vous pouvez spécifier la durée pendant laquelle une requête de ressource mise en file d'attente reste valide à l'aide de l'indicateur --valid-until-duration
. L'exemple suivant demande une version v4-32 qui
expire si le champ n'est pas rempli dans les six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente après un délai spécifié
Vous pouvez spécifier un délai au bout duquel une ressource doit être allouée à l'aide de l'option --valid-after-time
.
La commande suivante demande un TPU v4-4096 avec
la version d'exécution tpu-vm-tf-2.17.0-pjrt
sera allouée après le 14 décembre 2022 à 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Heure à partir de laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente avant un délai spécifié
Vous pouvez spécifier l'heure avant laquelle la ressource doit être allouée à l'aide de la classe
--valid-until-time
.
La commande suivante demande la création d'un TPU v4-4096 avec la version d'exécution tpu-vm-tf-2.10.0-pod
au plus tard le 14 décembre 2022 à 9h00.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez Date et heure des sujets de la Google Cloud CLI.
Demander l'allocation d'une ressource mise en file d'attente dans un intervalle spécifié
Vous pouvez spécifier un intervalle d'allocation à l'aide de n'importe quelle paire des indicateurs --valid-after-time
, --valid-after-duration
, --valid-until-duration
et --valid-until-time
, à condition qu'un indicateur spécifie le début de l'intervalle d'allocation et l'autre la fin de l'intervalle d'allocation.
La commande suivante demande une version v4-32 en 5 heures et 30 minutes à partir du à l'heure actuelle, au plus tard le 14 décembre 2022 à 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-timw
- Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
Demander une ressource mise en file d'attente avec un script de démarrage
Vous pouvez spécifier un script à exécuter sur une ressource en file d'attente une fois qu'il a été
provisionnés. Lorsque vous utilisez la commande gcloud
, vous pouvez utiliser l'option --metadata
ou --metadata-from-file
pour spécifier respectivement une commande de script ou un fichier contenant le code de script. Lorsque vous utilisez curl
, vous devez inclure le code de script dans le contenu JSON. L'exemple suivant crée une ressource en file d'attente
qui exécutera le script contenu dans startup-script.sh
. L'exemple curl
montre un script intégré dans le corps JSON.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Durée de validité de la requête, au terme de laquelle elle est annulée. Pour en savoir plus sur les formats de durée, consultez Date et heure du sujet Google Cloud CLI.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de valeur chemin d'accès complet au fichier de métadonnées, la commande suppose qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage s'exécute lorsque la ressource en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage s'exécute lorsque la ressource en file d'attente est provisionnée.
Demander des ressources en file d'attente avec un réseau et un sous-réseau spécifiés
Vous pouvez demander une ressource en file d'attente spécifiant le réseau et le sous-réseau auquel vous souhaitez connecter le TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- Réseau auquel la ressource mise en file d'attente appartient.
subnetwork
- Sous-réseau auquel la ressource mise en file d'attente fera partie.
Supprimer une requête de ressource en file d'attente
Vous pouvez supprimer une requête de ressources en file d'attente et la VM TPU créée par la requête en transmettant l'indicateur --force
à la commande queued-resource delete
. Sinon,
vous devez supprimer la VM TPU avant de supprimer la requête de ressource en file d'attente. Lorsque vous supprimez la VM TPU, la requête de ressource en file d'attente passe à l'état SUSPENDED
, après quoi la requête de ressource en file d'attente peut être supprimée.
Les commandes suivantes suppriment la requête de ressource en file d'attente nommée
"my-queued-resource" dans "my-project" dans la zone "us-central2-b". Il utilise l'indicateur --force
pour supprimer à la fois la VM TPU et la requête de ressource en file d'attente.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
project
- Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.
Les commandes suivantes suppriment la requête de ressource mise en file d'attente nommée "my-queued-resource" dans le projet "my-project" dans la zone "us-central2-b".
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressource en file d'attente.
project
- Projet Google Cloud où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Récupérer l'état et les informations de diagnostic d'une requête de ressource mise en file d'attente
Récupérez les informations d'état et de diagnostic d'une requête de ressource en file d'attente:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
- ID du projet où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Si la requête échoue, la réponse contient des informations d'erreur. Pour une requête qui attend des ressources, le résultat ressemble à ce qui suit :
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Lister les requêtes de ressources en file d'attente dans votre projet
La commande suivante permet de lister les requêtes de ressources en file d'attente dans le projet "your-project-id" :
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Description des options de commande
project
- Projet Google Cloud où la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.