Guide de l'utilisateur des ressources en file d'attente

Les ressources en file d'attente vous permettent de demander des ressources Cloud TPU en file d'attente. Lorsque vous demandez des ressources en file d'attente, elles sont ajoutées à une file d'attente gérée par au service Cloud TPU. Lorsque la ressource demandée devient disponible, attribuée à votre projet Google Cloud pour une utilisation exclusive immédiate. Il sera conservé attribué à votre projet, sauf si vous le supprimez ou s'il est préempté. Uniquement Les VM TPU Spot et les TPU préemptifs sont éligibles à la préemption.

Vous pouvez spécifier un heures de début et de fin d'une file d'attente demande de ressource. L'heure de début indique l'heure la plus proche à laquelle la demande. Si une demande n'a pas été satisfaite avant l'heure de fin spécifiée, la propriété expire. La demande reste dans la file d'attente après son expiration.

Les demandes de ressources en file d'attente peuvent présenter l'un des états suivants:

WAITING_FOR_RESOURCES
La requête a réussi la validation initiale et a été ajoutée à la file d'attente. Elle reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources disponibles pour commencer le provisionnement de votre requête ou l'intervalle d'allocation s'écoule. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être immédiatement provisionnés. Si vous avez besoin d'une capacité d'obtention des TPU plus fiable, envisagez l'achat d'une réservation. <ph type="x-smartling-placeholder">
PROVISIONING
La requête a été sélectionnée dans la file d'attente et ses ressources sont en cours d'allocation.
ACTIVE
La requête a été allouée. Lorsque les demandes de ressources en file d'attente se trouvent dans ACTIVE, vous pouvez gérer vos VM TPU comme décrit dans Gérer les TPU
FAILED
La demande n'a pas pu être traitée, soit en raison d'un problème avec le ou que les ressources demandées n'étaient pas disponibles dans l'intervalle d'allocation. La requête reste dans la file d'attente jusqu'à ce qu'elle soit explicitement supprimée.
SUSPENDING
Les ressources associées à la requête sont en cours de suppression.
SUSPENDED
Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une requête est à l'état SUSPENDED, il ne peut plus être utilisé l'allocation de ressources.

Prérequis

Avant d'exécuter les commandes de ce guide, assurez-vous de:

Demander une ressource en file d'attente à la demande

Vous pouvez demander une ressource en file d'attente à la demande à l'aide de la commande gcloud compute tpus queued-resources create. Pour en savoir plus sur à la demande, consultez la section Types de quotas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.17.0-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID du TPU attribué par l'utilisateur, créé lors de la mise en file d'attente demande de ressource est allouée.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.

Tailles de tranche par défaut pour les ressources en file d'attente à la demande

Lorsque vous utilisez un quota à la demande, vous devez demander une taille de tranche inférieure à limite par défaut pour le type d'accélérateur utilisé. Les requêtes qui dépassent la les limites par défaut sont refusées par le système.

Le tableau suivant présente les types de TPU et les TPU les limites par défaut.

Type d'accélérateur Limite par défaut (en nombre de TensorCores)
v2 128
v3 128
v4 384
v5 32

Si vous avez besoin de tranches plus importantes, contactez Cloud TPU .

Demander une ressource en file d'attente à l'aide d'une réservation

Vous pouvez demander une ressource en file d'attente à l'aide d'une réservation en spécifiant le l'option --reserved dans votre commande gcloud ou guaranteed.reserved=true dans votre requête curl. Pour acheter une réservation, contactez l'équipe chargée de votre compte Google Cloud.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.17.0-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID du TPU attribué par l'utilisateur, créé lors de la mise en file d'attente demande de ressource est allouée.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cette option lorsque vous demandez des ressources en file d'attente dans un Cloud TPU réservation.

Demander une ressource de VM Spot TPU en file d'attente

Une VM Spot est une ressource qui peut être préemptée et attribuées à une autre charge de travail à tout moment. Ressources de VM Spot moins onéreux, et vous pourriez avoir accès aux ressources plus tôt requête de VM non Spot. Pour en savoir plus sur les TPU, Pour les VM Spot, consultez la page Gérer les VM Spot TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.17.0-pjrt \
--spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
spot
Indicateur booléen spécifiant que la ressource en file d'attente est une VM Spot.

Demander l'allocation d'une ressource en file d'attente avant ou après un délai spécifié

Vous pouvez spécifier une heure de début (facultatif), heure, début durée ou fin durée dans une requête de ressource en file d'attente. La l'heure de début ou la durée de début indique l'heure de début la plus proche à laquelle doit requête. Si une demande n'a pas été satisfaite avant l'heure de fin spécifiée ou dans les pendant la durée spécifiée, la demande expirera. Une fois la demande expirée, reste dans la file d'attente, mais ne peut plus être alloué.

Vous pouvez également spécifier un intervalle d'allocation : en spécifiant une heure de début ou une durée, et une heure de fin ou une durée.

Voir Datetime (Date/Heure) d'une liste des formats de code temporel et de durée acceptés.

Demander une ressource en file d'attente après une durée spécifiée

Vous pouvez spécifier la durée après laquelle une ressource doit être allouée à l'aide de la méthode l'option --valid-after-duration. L'exemple suivant demande qu'une version v4-32 soit alloué après six heures.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-after-duration
Durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez Date et heure de la rubrique Google Cloud CLI.
.

Demander une ressource en file d'attente qui expire après une durée spécifiée

Vous pouvez spécifier la durée de validité d'une requête de ressource en file d'attente avec l'option --valid-until-duration. L'exemple suivant demande une version v4-32 qui expire si le champ n'est pas rempli dans les six heures.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-duration
Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez Date et heure de la rubrique Google Cloud CLI.
.

Demander une ressource en file d'attente après un délai spécifié

Vous pouvez spécifier le délai après lequel une ressource doit être allouée à l'aide de la variable --valid-after-time.

La commande suivante demande un TPU v4-4096 avec la version d'exécution tpu-vm-tf-2.17.0-pjrt sera allouée après le 14 décembre 2022 à 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-after-time
Délai au terme duquel la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez la section Date/Heure de la rubrique Google Cloud CLI.

Demander une ressource en file d'attente avant un délai spécifié

Vous pouvez spécifier l'heure avant laquelle la ressource doit être allouée à l'aide de la classe --valid-until-time.

La commande suivante demande un TPU v4-4096 avec version d'exécution tpu-vm-tf-2.10.0-pod au plus tard le 14 décembre 2022 à 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-time
Délai après lequel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez Date et heure des sujets de la Google Cloud CLI.

Demander l'allocation d'une ressource en file d'attente dans un intervalle spécifié

Vous pouvez spécifier un intervalle d'allocation à l'aide de n'importe quelle paire de --valid-after-time, les options --valid-after-duration, --valid-until-duration et --valid-until-time ; à condition qu'un indicateur spécifie le début de l'intervalle d'allocation et other indique la fin de l'intervalle d'allocation.

La commande suivante demande une version v4-32 en 5 heures et 30 minutes à partir du à l'heure actuelle, au plus tard le 14 décembre 2022 à 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
valid-until-timw
Délai après lequel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez Date et heure des sujets de la Google Cloud CLI.
valid-until-duration
Durée de validité de la requête. Pour en savoir plus sur les formats de durée, consultez Date et heure des sujets de la Google Cloud CLI.

Demander une ressource en file d'attente avec un script de démarrage

Vous pouvez spécifier un script à exécuter sur une ressource en file d'attente une fois qu'il a été provisionnés. Lorsque vous utilisez la commande gcloud, vous pouvez utiliser soit --metadata ou --metadata-from-file pour spécifier une commande de script ou un fichier contenant le code du script. Lorsque vous utilisez curl, vous devez inclure le script. dans le contenu JSON. L'exemple suivant crée une ressource en file d'attente qui exécutera le script contenu dans startup-script.sh. curl montre un script intégré dans le corps JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.17.0-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
ID du projet où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
validInterval
Délai de validité de la requête après lequel elle est annulée(s). Pour en savoir plus sur les formats de durée, consultez Date et heure du sujet Google Cloud CLI.
metadata-from-file
Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de valeur chemin d'accès complet au fichier de métadonnées, la commande suppose qu'il se trouve dans le répertoire répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage est exécutée lorsque la ressource en file d'attente est provisionnée.
metadata
Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage s'exécute lorsque la ressource en file d'attente est provisionnée.

Demander une ressource en file d'attente avec un réseau et un sous-réseau spécifiés

Vous pouvez demander une ressource en file d'attente spécifiant le réseau et le sous-réseau auquel vous souhaitez connecter le TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.17.0-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Description des paramètres de commande

queued-resource-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
node-id
ID du TPU attribué par l'utilisateur, créé lors de la mise en file d'attente demande de ressource est allouée.
project
Votre projet Google Cloud.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
Le type d'accélérateur spécifie la version et la taille de la ressource Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
Version du logiciel Cloud TPU.
reserved
Utilisez cette option lorsque vous demandez des ressources en file d'attente dans un Cloud TPU réservation.
network
Réseau auquel la ressource en file d'attente fera partie.
subnetwork
Sous-réseau auquel la ressource en file d'attente fera partie.

Supprimer une requête de ressource en file d'attente

Vous pouvez supprimer une demande de ressource en file d'attente et la VM TPU créée par la requête en transmettant l'option --force à la commande queued-resource delete. Sinon, vous devez supprimer la VM TPU avant de supprimer la requête de ressource en file d'attente. Lorsque vous supprimer la VM TPU, la demande de ressource en file d'attente passe au SUSPENDED, après lequel la requête de ressource en file d'attente peut être supprimés.

Les commandes suivantes suppriment la requête de ressource en file d'attente nommée "my-queued-resource" dans "my-project" dans la zone "us-central2-b". Il utilise l'option --force pour supprimer à la fois la VM TPU et la ressource en file d'attente. requête.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone du Cloud TPU à supprimer.
force
Supprimez à la fois la VM TPU et la requête de ressource en file d'attente.

Les commandes suivantes suppriment la requête de ressource en file d'attente nommée "my-queued-resource" dans "my-project" dans la zone "us-central2-b".

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Récupérer les informations d'état et de diagnostic d'une requête de ressource en file d'attente

Récupérez les informations d'état et de diagnostic d'une requête de ressource en file d'attente:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Description des options de commande

queued-resource-request-id
ID attribué par l'utilisateur à la requête de ressource en file d'attente.
project
ID du projet où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.

Si la requête échoue, la réponse contient des informations sur l'erreur. Pour une demande attend des ressources, le résultat ressemble à ce qui suit:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Lister les demandes de ressources en file d'attente dans votre projet

La commande suivante permet de lister les requêtes de ressources en file d'attente dans le projet "your-project-id" :

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Description des options de commande

project
Projet Google Cloud où la ressource en file d'attente est allouée.
zone
Zone dans laquelle vous prévoyez de créer votre Cloud TPU.