Guide de l'utilisateur des ressources en file d'attente
Les ressources en file d'attente vous permettent de demander des ressources Cloud TPU en file d'attente. Lorsque vous demandez des ressources en file d'attente, la requête est ajoutée à une file d'attente gérée par le service Cloud TPU. Lorsque la ressource demandée devient disponible, elle est attribuée à votre projet Google Cloud pour votre utilisation exclusive immédiate. Elle restera attribuée à votre projet, sauf si vous la supprimez ou si elle est préemptée. Seuls les TPU préemptifs sont éligibles à la préemption.
Vous pouvez éventuellement spécifier une heure de début et une heure de fin dans une requête de ressource en file d'attente. L'heure de début spécifie la première heure à partir de laquelle répondre à la requête. Si une requête n'a pas été satisfaite à l'heure de fin spécifiée, elle expire. La requête reste dans la file d'attente après son expiration.
Les requêtes de ressources mises en file d'attente peuvent présenter l'un des états suivants:
WAITING_FOR_RESOURCES
- La requête a passé la validation initiale et a été ajoutée à la file d'attente. Il reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources libres pour commencer à provisionner votre requête ou jusqu'à ce que l'intervalle d'allocation se soit écoulé. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être provisionnées immédiatement. Si vous avez besoin d'une obtention plus fiable de TPU, envisagez d'acheter une réservation.
PROVISIONING
- La requête a été sélectionnée dans la file d'attente et ses ressources sont en cours d'allocation.
ACTIVE
- La demande a été allouée. Lorsque des demandes de ressources en file d'attente sont à l'état
ACTIVE
, vous pouvez gérer vos VM TPU comme décrit dans la section Gérer les TPU. FAILED
- Impossible de traiter la requête, car elle présente un problème ou les ressources demandées ne sont pas disponibles pendant l'intervalle d'allocation. La requête reste dans la file d'attente jusqu'à ce qu'elle soit explicitement supprimée.
SUSPENDING
- Les ressources associées à la requête sont en cours de suppression.
SUSPENDED
- Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une requête présente l'état
SUSPENDED
, elle ne peut plus être allouée.
Prérequis
Avant d'exécuter les commandes de ce guide, assurez-vous d'avoir effectué les opérations suivantes:
- installer les composants alpha de la Google Cloud CLI ;
- Activer l'API Cloud TPU
Demander une ressource en file d'attente à la demande
Vous pouvez demander une ressource en file d'attente à la demande à l'aide de la commande gcloud alpha compute tpus queued-resources create
. Pour en savoir plus sur les ressources à la demande, consultez la section Types de quotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU, qui est créé lorsque la requête de ressource en file d'attente est allouée.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
Tailles de tranche par défaut pour les ressources en file d'attente à la demande
Lorsque vous utilisez un quota à la demande, vous devez demander une taille de tranche inférieure à la limite par défaut pour le type d'accélérateur que vous utilisez. Les requêtes qui dépassent les limites par défaut sont refusées par le système.
Le tableau suivant présente les types de TPU et les limites par défaut associées.
Type d'accélérateur | Limite par défaut (en nombre de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si vous avez besoin de tranches de plus grande taille, contactez l'assistance Cloud TPU pour en savoir plus.
Demander une ressource en file d'attente à l'aide d'un quota réservé
Vous pouvez demander une ressource en file d'attente à l'aide d'un quota réservé en spécifiant l'option --reserved
dans votre commande gcloud
ou guaranteed.reserved=true
dans votre requête curl. Pour en savoir plus sur les quotas réservés, consultez la section Types de quotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU, qui est créé lorsque la requête de ressource en file d'attente est allouée.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cette option lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
Demander une ressource préemptive en file d'attente
Vous pouvez demander une ressource préemptive en file d'attente. Une ressource préemptive est une ressource qui peut être attribuée à une autre charge de travail si d'autres charges de travail ont besoin de ressources supplémentaires. Les ressources préemptives coûtent moins cher et vous pouvez avoir accès aux ressources plus tôt qu'une requête non préemptive. Pour en savoir plus sur les quotas préemptifs, consultez la section Types de quotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
best-effort
- Indicateur booléen spécifiant que la ressource en file d'attente est préemptive.
Demander l'allocation d'une ressource en file d'attente avant ou après une heure spécifiée
Vous pouvez éventuellement spécifier une heure de début, une heure de fin, une durée de début ou une durée de fin dans une requête de ressource en file d'attente. L'heure de début ou la durée de début spécifie le premier moment auquel répondre à la requête. Si une requête n'a pas été satisfaite avant l'heure de fin spécifiée ou pendant la durée spécifiée, la requête expire. Une fois la requête arrivée à expiration, elle reste dans la file d'attente, mais ne peut plus être allouée.
Vous pouvez également spécifier un intervalle d'allocation en indiquant une heure de début ou une durée, et une heure ou une durée de fin.
Consultez la section Date/Heure pour obtenir la liste des formats d'horodatage et de durée acceptés.
Demander une ressource en file d'attente après une durée spécifiée
Vous pouvez spécifier une durée après laquelle une ressource doit être allouée à l'aide de l'option --valid-after-duration
. L'exemple suivant demande l'allocation d'une version v4-32 au bout de six heures.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-duration
- Durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente qui expire après une durée spécifiée
Vous pouvez spécifier la durée pendant laquelle une requête de ressource en file d'attente reste valide à l'aide de l'option --valid-until-duration
. L'exemple suivant demande une version v4-32 qui expire si elle n'est pas remplie dans les six heures.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente après un délai spécifié
Vous pouvez spécifier un délai après lequel une ressource doit être allouée à l'aide de l'option --valid-after-time
.
La commande suivante demande l'allocation d'un TPU v4-4096 avec la version d'exécution tpu-vm-tf-2.16.1-pjrt
après le 14 décembre 2022 à 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Délai au terme duquel la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente avant une heure spécifiée
Vous pouvez spécifier un délai avant l'allocation de la ressource à l'aide de l'option --valid-until-time
.
La commande suivante demande qu'un nœud TPU v4-4096 avec la version d'exécution tpu-vm-tf-2.10.0-pod
soit créé au plus tard le 14 décembre 2022 à 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- Délai au terme duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
Demander l'allocation d'une ressource en file d'attente pendant un intervalle spécifié
Vous pouvez spécifier un intervalle d'allocation à l'aide de n'importe quelle paire d'options --valid-after-time
, --valid-after-duration
, --valid-until-duration
et --valid-until-time
, à condition que l'une indique le début de l'intervalle d'allocation et l'autre la fin.
La commande suivante demande une version v4-32 dans un délai de 5 heures et 30 minutes à compter de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-timw
- Délai au terme duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
valid-until-duration
- Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
Demander une ressource en file d'attente à l'aide d'un script de démarrage
Vous pouvez spécifier un script à exécuter sur une ressource en file d'attente après son provisionnement. Lorsque vous utilisez la commande gcloud
, vous pouvez utiliser l'option --metadata
ou --metadata-from-file
pour spécifier une commande de script ou un fichier contenant le code du script, respectivement. Lorsque vous utilisez curl
, vous devez inclure le code du script dans le contenu JSON. L'exemple suivant crée une requête de ressource en file d'attente qui exécutera le script contenu dans startup-script.sh
. L'exemple curl
montre un script intégré dans le corps JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Délai de validité de la requête après lequel elle est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la rubrique Google Cloud CLI.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande suppose qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui s'exécute lorsque la ressource en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées correspondent à une commande de script de démarrage exécutée lorsque la ressource en file d'attente est provisionnée.
Demander une ressource en file d'attente avec un réseau et un sous-réseau spécifiés
Vous pouvez demander une ressource en file d'attente en spécifiant le réseau et le sous-réseau auxquels vous souhaitez connecter votre TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Description des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
node-id
- ID attribué par l'utilisateur du TPU, qui est créé lorsque la requête de ressource en file d'attente est allouée.
project
- Votre projet Google Cloud.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cette option lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- Réseau auquel la ressource en file d'attente sera associée.
subnetwork
- Sous-réseau dont la ressource en file d'attente sera associée.
Supprimer une requête de ressource en file d'attente
Vous pouvez supprimer une requête de ressource en file d'attente et la VM TPU créée par la requête en transmettant l'option --force
à la commande queued-resource delete
. Sinon, vous devez supprimer la VM TPU avant de supprimer la requête de ressource en file d'attente. Lorsque vous supprimez la VM TPU, la requête de ressource en file d'attente passe à l'état SUSPENDED
, après quoi la requête de ressource en file d'attente peut être supprimée.
Les commandes suivantes suppriment la requête de ressource en file d'attente nommée "my-queued-resource" dans le projet "my-project" de la zone "us-central2-b". L'option --force
permet de supprimer à la fois la VM TPU et la demande de ressources en file d'attente.
gcloud
gcloud alpha compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez la VM TPU et la requête de ressource en file d'attente.
Les commandes suivantes suppriment la requête de ressource en file d'attente nommée "my-queued-resource" dans le projet "my-project" de la zone "us-central2-b".
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Récupérer les informations d'état et de diagnostic d'une requête de ressource en file d'attente
Récupérez l'état et les informations de diagnostic d'une requête de ressource en file d'attente:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur pour la requête de ressource en file d'attente.
project
- ID du projet dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Si la requête échoue, la réponse contient des informations sur l'erreur. Pour une requête en attente de ressources, le résultat se présente comme suit:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Répertorier les demandes de ressources en file d'attente dans votre projet
La commande suivante permet de lister les requêtes de ressources en file d'attente dans le projet "your-project-id":
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Description des options de commande
project
- Projet Google Cloud dans lequel la ressource en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.