Gérer les ressources en file d'attente

Les ressources en file d'attente vous permettent de demander des ressources Cloud TPU via une file d'attente. Lorsque vous demandez des ressources en mode file d'attente, la demande est ajoutée à une file d'attente gérée par le service Cloud TPU. Lorsque la ressource demandée est disponible, elle est attribuée à votre projet Google Cloud pour votre utilisation exclusive et immédiate. Il restera attribué à votre projet, sauf si vous le supprimez ou si un autre projet le préempte. Seules les VM Spot TPU et les TPU préemptifs peuvent être préemptées.

Vous pouvez spécifier une heure de début et de fin facultative dans une requête de ressources mise en file d'attente. L'heure de début spécifie l'heure la plus proche à laquelle la requête doit être traitée. Si une demande n'a pas été traitée avant l'heure de fin spécifiée, elle expire. La requête reste dans la file d'attente après avoir expiré.

Les requêtes de ressources mises en file d'attente peuvent avoir l'un des états suivants:

WAITING_FOR_RESOURCES
La requête a passé la validation initiale et a été ajoutée à la file d'attente. Il reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources libres pour commencer à provisionner votre requête ou jusqu'à ce que l'intervalle d'allocation expire. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être provisionnées immédiatement. Si vous avez besoin d'une disponibilité plus fiable des TPU, envisagez d'acheter une réservation.
PROVISIONING
La requête a été sélectionnée dans la file d'attente et ses ressources sont en cours d'allocation.
ACTIVE
La requête a été allouée. Lorsque les requêtes de ressources en file d'attente sont à l'état ACTIVE, vous pouvez gérer vos VM TPU comme décrit dans la section Gérer les TPU.
FAILED
La requête n'a pas pu être traitée, soit en raison d'un problème avec la requête, soit parce que les ressources demandées n'étaient pas disponibles dans l'intervalle d'allocation. La requête reste dans la file d'attente jusqu'à ce qu'elle soit supprimée explicitement.
SUSPENDING
Les ressources associées à la requête sont en cours de suppression.
SUSPENDED
Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une requête est à l'état SUSPENDED, elle n'est plus éligible à une nouvelle allocation.

Prérequis

Avant d'exécuter les commandes de ce guide, vous devez installer Google Cloud CLI, créer un projet Google Cloud et activer l'API Cloud TPU. Pour obtenir des instructions, consultez la section Configurer l'environnement Cloud TPU.

Demander une ressource en file d'attente à la demande

Les ressources à la demande ne seront pas préemptées, mais le quota à la demande ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre demande. Pour en savoir plus sur les ressources à la demande, consultez la section Types de quotas.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

Tailles de tranche par défaut pour les ressources mises en file d'attente à la demande

Lorsque vous utilisez un quota à la demande, vous devez demander une taille de tranche inférieure à la limite par défaut pour le type d'accélérateur que vous utilisez. Les requêtes qui dépassent les limites par défaut sont refusées par le système.

Le tableau suivant présente les types de TPU et les limites par défaut associées.

Type d'accélérateur Limite par défaut (en nombre de TensorCores)
v2 128
v3 128
v4 384
v5 32

Si vous avez besoin de tailles de tranche plus importantes, contactez l'assistance Cloud TPU pour en savoir plus.

Demander une ressource en file d'attente à l'aide d'une réservation

Vous pouvez demander une ressource en file d'attente à l'aide d'une réservation. Pour acheter une réservation, contactez l'équipe chargée de votre compte Google Cloud.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --reserved

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Développez la section Gestion.

  10. Cochez la case Utiliser une réservation existante.

  11. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

Demander une ressource en file d'attente pour une VM Spot TPU

Une VM Spot est une ressource qui peut être préemptée et attribuée à une autre charge de travail à tout moment. Les ressources des VM Spot coûtent moins cher, et vous pouvez y accéder plus rapidement qu'avec une demande de VM non Spot. Pour en savoir plus sur les VM Spot TPU, consultez Gérer les VM Spot TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.18.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.18.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
spot
Indicateur booléen indiquant que la ressource mise en file d'attente est une VM spot.

Demander l'allocation d'une ressource mise en file d'attente avant ou après une heure spécifiée

Vous pouvez spécifier une heure de début ou une heure de fin facultative dans une requête de ressources mise en file d'attente. L'heure de début ou la durée de début spécifie l'heure la plus précoce à laquelle la requête doit être traitée. L'heure de fin ou la durée de fin spécifient la durée pendant laquelle la requête reste valide. Si une demande n'a pas été satisfaite avant la date de fin ou la durée spécifiées, elle expire. Une fois la requête expirée, elle reste dans la file d'attente, mais ne peut plus être allouée.

Vous pouvez également spécifier un intervalle d'allocation en spécifiant une heure de début ou une durée, ainsi qu'une heure de fin ou une durée.

Pour obtenir la liste des formats d'horodatage et de durée acceptés, consultez la section Date/Heure.

Demander qu'une ressource mise en file d'attente soit traitée après un délai spécifié

Dans une requête de ressource mise en file d'attente, vous pouvez spécifier une heure ou une durée après laquelle une ressource doit être allouée.

gcloud

La commande suivante demande un TPU v4-4096 à allouer après 9h le 14 décembre 2022.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-time 2022-12-14T09:00:00Z

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-after-time
Heure à partir de laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez Date et heure de la discussion Google Cloud CLI.

curl

La commande suivante demande un TPU v4-4096 à allouer après 9h le 14 décembre 2022.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_after_time': {
        'seconds': 2022-12-14T09:00:00Z
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-after-time
Heure à partir de laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez Date et heure de la discussion Google Cloud CLI.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Dans le champ Début de la requête, saisissez l'heure à partir de laquelle la ressource doit être allouée.

  10. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

L'exemple suivant demande l'allocation d'un v4-32 au bout de six heures.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
        --node-id your-node-id \
        --project your-project-id \
        --zone us-central2-b \
        --accelerator-type v4-32 \
        --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
        --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_after_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-after-duration
Durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez Date et heure de l'objet Google Cloud CLI

Demander une ressource mise en file d'attente qui expire après un délai spécifié

Dans une requête de ressources mise en file d'attente, vous pouvez spécifier la durée pendant laquelle une requête de ressources mise en file d'attente reste valide. Si la requête n'a pas été traitée avant l'heure ou la durée que vous spécifiez, elle expire.

gcloud

La commande suivante demande un TPU v4-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h, elle expirera.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-time 2022-12-14T09:00:00Z

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-time
Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.

curl

La commande suivante demande un TPU v4-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h, elle expirera.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_until_time': {
        'seconds': 1655197200
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-time
Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Dans le champ Cancel request on (Annuler la requête à partir de), saisissez l'heure à laquelle la requête de ressource mise en file d'attente doit expirer si elle n'est pas remplie.

  10. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

L'exemple suivant demande une version v4-32. La demande expire si elle n'est pas traitée dans un délai de six heures.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_until_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-duration
Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'objet Google Cloud CLI
.

Demander l'allocation d'une ressource mise en file d'attente dans un intervalle spécifié

Vous pouvez spécifier un intervalle d'allocation en indiquant à la fois l'heure de début ou la durée, ainsi que l'heure de fin ou la durée.

gcloud

La commande suivante demande une version 4-32 dans cinq heures et 30 minutes à compter de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-duration 5h30m \
    --valid-until-time 2022-12-14T09:00:00Z

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-timw
Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
valid-until-duration
Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.

curl

La commande suivante demande une version 4-32 dans cinq heures et 30 minutes à compter de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-timw
Heure à partir de laquelle la requête est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.
valid-until-duration
Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de l'élément de la Google Cloud CLI.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Dans le champ Début de la requête, saisissez l'heure à partir de laquelle la ressource doit être allouée.

  10. Dans le champ Cancel request on (Annuler la requête à partir de), saisissez l'heure à laquelle la requête de ressource mise en file d'attente doit expirer si elle n'est pas remplie.

  11. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

Demander une ressource mise en file d'attente avec un script de démarrage

Vous pouvez spécifier un script à exécuter sur une ressource mise en file d'attente après son provisionnement.

gcloud

Lorsque vous utilisez la commande gcloud, vous pouvez utiliser l'option --metadata ou --metadata-from-file pour spécifier respectivement une commande de script ou un fichier contenant le code de script. L'exemple suivant crée une requête de ressource mise en file d'attente qui exécutera le script startup-script.sh.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.12.0 \
    --metadata-from-file='startup-script=startup-script.sh'

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
validInterval
Durée de validité de la requête, après quoi elle est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la discussion Google Cloud CLI.
metadata-from-file
Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande part du principe qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui s'exécute lorsque la ressource mise en file d'attente est provisionnée.
metadata
Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.

curl

Lorsque vous utilisez curl, vous devez inclure le code du script dans le contenu JSON. L'exemple suivant inclut un script intégré dans le corps JSON.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    tpu: {
        node_spec: {
        parent: 'projects/your-project-number/locations/us-central2-b',
        node_id: 'your-node-id',
        node: {
            accelerator_type: 'v2-8',
            runtime_version: 'tpu-vm-tf-2.18.0-pjrt',
            metadata: {
                "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
            }
        }
        }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
validInterval
Durée de validité de la requête, après quoi elle est annulée. Pour en savoir plus sur les formats de durée, consultez la section Date et heure de la discussion Google Cloud CLI.
metadata-from-file
Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande part du principe qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui s'exécute lorsque la ressource mise en file d'attente est provisionnée.
metadata
Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.

Demander une ressource mise en file d'attente avec un réseau et un sous-réseau spécifiés

Dans une requête de ressources en file d'attente, vous pouvez spécifier un réseau et un sous-réseau auxquels vous souhaitez connecter votre TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --network network-name \
    --subnetwork subnetwork-name

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
Réseau auquel la ressource mise en file d'attente appartient.
subnetwork
Sous-réseau auquel la ressource mise en file d'attente fera partie.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        'network_config': {
            'network': 'network-name',
            'subnetwork': 'subnetwork-name',
            'enable_external_ips': true
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descriptions des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
node-id
ID attribué par l'utilisateur du TPU créé lors de l'allocation de la requête de ressource mise en file d'attente.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
Réseau auquel la ressource mise en file d'attente appartient.
subnetwork
Sous-réseau auquel la ressource mise en file d'attente fera partie.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur Créer un TPU.

  3. Dans le champ Nom, saisissez un nom pour votre TPU.

  4. Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.

  5. Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.

  6. Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez la section Images de VM TPU.

  7. Cliquez sur le bouton Activer la mise en file d'attente.

  8. Dans le champ Nom de la ressource mise en file d'attente, saisissez un nom pour votre requête de ressource mise en file d'attente.

  9. Développez la section Réseau.

  10. Dans les champs Réseau et Sous-réseau, sélectionnez le réseau et le sous-réseau que vous souhaitez utiliser.

  11. Cliquez sur Créer pour créer votre requête de ressource mise en file d'attente.

Supprimer une requête de ressource en file d'attente

Vous pouvez supprimer une requête de ressource en file d'attente et le TPU associé à la requête en supprimant la requête de ressource en file d'attente:

gcloud

Transmettez l'option --force à la commande queued-resource delete:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project my-project \
    --zone us-central2-b \
    --force \
    --async

Description des options de commande

your-queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.
force
Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.

curl

Utilisez le paramètre de requête force=true dans votre requête curl:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/your-queued-resource-id?force=true

Description des options de commande

your-queued-resource-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.
force
Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur l'onglet Ressources en file d'attente.

  3. Cochez la case à côté de votre demande de ressources mise en file d'attente.

  4. Cliquez sur Supprimer.

Si vous supprimez directement le TPU, vous devez également supprimer la ressource en file d'attente, comme illustré dans l'exemple suivant. Lorsque vous supprimez le TPU, la requête de ressource mise en file d'attente passe à l'état SUSPENDED, après quoi elle peut être supprimée.

gcloud

Supprimez le TPU:

$ gcloud compute tpus tpu-vm delete your-node-id \
    --project=your-project \
    --zone=zone \
    --quiet

Description des options de commande

project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.
your-node-id
Nom du TPU que vous souhaitez supprimer.

Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING, puis à l'état SUSPENDED. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED, vous pouvez la supprimer:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project your-project-id \
    --zone us-central2-b

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.

curl

Supprimez le TPU:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project/locations/us-central2-b/nodes?node_id=your-node-id

Description des options de commande

project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.
your-node-id
Nom du TPU que vous souhaitez supprimer.

Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING, puis à l'état SUSPENDED. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED, vous pouvez la supprimer:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.

Console

Supprimez votre TPU:

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cochez la case située à côté de votre TPU.

  3. Cliquez sur Supprimer.

Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état En cours de suspension, puis à l'état Suspendu. Lorsque votre ressource en file d'attente est à l'état Suspendu, vous pouvez la supprimer:

  1. Cliquez sur l'onglet Ressources en file d'attente.
  2. Cochez la case à côté de votre demande de ressources mise en file d'attente.
  3. Cliquez sur Supprimer.

Récupérer l'état et les informations de diagnostic d'une requête de ressource mise en file d'attente

Récupérez l'état et les informations de diagnostic d'une requête de ressource mise en file d'attente:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
    --project your-project-id \
    --zone us-central2-b

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressources mise en file d'attente.
project
ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur l'onglet Ressources en file d'attente.

  3. Cliquez sur le nom de votre demande de ressources mise en file d'attente.

Une fois votre TPU provisionné, vous pouvez également consulter les détails de votre demande de ressources mise en file d'attente en accédant à la page TPU, en recherchant votre TPU, puis en cliquant sur le nom de la demande de ressources mise en file d'attente correspondante.

Si la requête échoue, la sortie contient des informations d'erreur. Pour une requête qui attend des ressources, le résultat ressemble à ceci:

gcloud

    name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
    state:
    state: WAITING_FOR_RESOURCES
    tpu:
    nodeSpec:
    - node:
        acceleratorType: v4-8
        bootDisk: {}
        networkConfig:
            enableExternalIps: true
        queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
        runtimeVersion: tpu-vm-tf-2.10.0
        schedulingConfig: {}
        serviceAccount: {}
        shieldedInstanceConfig: {}
        useTpuVm: true
        nodeId: your-node-id
        parent: projects/your-project-number/locations/us-central2-b

Console

Le champ État de la ressource en file d'attente affiche En attente de ressources.

Lister les requêtes de ressources en file d'attente dans votre projet

Répertoriez les requêtes de ressources en file d'attente de votre projet:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
    --zone us-central2-b

Description des options de commande

project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Description des options de commande

project
Projet Google Cloud dans lequel la ressource mise en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Console

  1. Dans la console Google Cloud, accédez à la page TPU:

    Accéder aux TPU

  2. Cliquez sur l'onglet Ressources en file d'attente.