Guía del usuario de recursos en cola
Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado está disponible, se asigna a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá asignada a tu proyecto, a menos que la borres o se interrumpa. Solo las VMs Spot de TPU y las TPU interrumpibles son aptas para la interrupción.
Puedes especificar una hora de inicio y finalización opcional en una solicitud de recurso en cola. La hora de inicio especifica la hora más temprana en la que se completará la solicitud. Si no se completa una solicitud en la hora de finalización especificada, esta vencerá. La solicitud permanece en la cola después de que vence.
Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:
WAITING_FOR_RESOURCES
- La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya suficientes recursos gratuitos para comenzar a aprovisionar tu solicitud o hasta que transcurra el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes se pueden aprovisionar de inmediato. Si necesitas una capacidad de obtener TPU más confiable, considera comprar una reserva.
PROVISIONING
- Se seleccionó la solicitud de la cola y sus recursos se están asignando actualmente.
ACTIVE
- Se asignó la solicitud. Cuando las solicitudes de recursos en cola tienen el estado
ACTIVE
, puedes administrar las VM de TPU como se describe en Administra TPU. FAILED
- No se pudo completar la solicitud, ya sea porque hubo un problema con ella o porque los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en la cola hasta que se borra explícitamente.
SUSPENDING
- Se están borrando los recursos asociados con la solicitud.
SUSPENDED
- Se borraron los recursos especificados en la solicitud. Cuando una solicitud se encuentra en el estado
SUSPENDED
, ya no es apta para una asignación adicional.
Requisitos previos
Antes de ejecutar los comandos de esta guía, asegúrate de hacer lo siguiente:
- Instala los componentes alfa de Google Cloud CLI
- Habilita la API de Cloud TPU
Cómo solicitar un recurso en cola a pedido
Puedes solicitar un recurso en cola a pedido con el comando gcloud compute tpus queued-resources create
. Para obtener más información sobre los recursos a pedido, consulta Tipos de cuotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
Tamaños predeterminados de porciones para recursos en cola a pedido
Cuando usas la cuota a pedido, debes solicitar un tamaño de porciones menor que el límite predeterminado para el tipo de acelerador que usas. El sistema rechaza las solicitudes que superan los límites predeterminados.
En la siguiente tabla, se muestran los tipos de TPU y sus límites predeterminados asociados.
Tipo de acelerador | Límite predeterminado (en cantidad de tensores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si necesitas porciones de mayor tamaño, comunícate con la asistencia de Cloud TPU para obtener más información.
Solicita un recurso en cola mediante una reserva
Puedes solicitar un recurso en cola mediante una reserva si especificas la marca --reserved
en el comando gcloud
o guaranteed.reserved=true
en la solicitud curl. Para comprar una reserva, comunícate con el equipo de cuentas de Google Cloud.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
Solicita un recurso en cola de VM Spot de TPU
Una VM Spot es un recurso que se puede interrumpir y asignar a otra carga de trabajo en cualquier momento. Los recursos de VM Spot cuestan menos y es posible que obtengas acceso a los recursos antes en comparación con una solicitud de VM no Spot. Para obtener más información sobre las VMs TPU Spot, consulta Administra las VMs Spot de TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
spot
- Es una marca booleana que especifica que el recurso en cola es una VM Spot.
Solicita que se asigne un recurso en cola antes o después de un tiempo especificado
Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recurso en cola. La hora de inicio o la duración de inicio especifica la primera hora en la que se debe completar la solicitud. Si no se completa una solicitud en la hora de finalización especificada o dentro de la duración especificada, la solicitud vencerá. Una vez que la solicitud venció, permanece en la cola, pero ya no es apta para la asignación.
También puedes especificar un intervalo de asignación especificando una hora de inicio o duración, y una hora de finalización o duración.
Consulta Fecha y hora para obtener una lista de los formatos de marca de tiempo y duración compatibles.
Solicita un recurso en cola después de una duración especificada
Puedes especificar la duración después de la cual se debe asignar un recurso con la marca --valid-after-duration
. En el siguiente ejemplo, se solicita que se asigne una v4-32 después de seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-after-duration
- Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI
Solicita un recurso en cola que venza después de una duración especificada
Puedes especificar durante cuánto tiempo es válida una solicitud de recurso en cola con la marca --valid-until-duration
. En el siguiente ejemplo, se solicita una v4-32 que vence si no se completa en seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-duration
- Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI
Cómo solicitar un recurso en cola después de un tiempo especificado
Puedes especificar el momento después del cual se debe asignar un recurso con la marca --valid-after-time
.
El siguiente comando solicita que se asigne una TPU v4-4096 con la versión de entorno de ejecución tpu-vm-tf-2.16.1-pjrt
después de las 9 a.m. del 14 de diciembre de 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-after-time
- La hora, después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
Cómo solicitar un recurso en cola antes del tiempo especificado
Puedes especificar el momento en que se debe asignar el recurso mediante la marca --valid-until-time
.
El siguiente comando solicita que se cree una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod
a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-time
- Es el momento en el que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
Solicita que se asigne un recurso en cola dentro de un intervalo especificado
Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time
, --valid-after-duration
, --valid-until-duration
y --valid-until-time
, siempre que una de ellas especifique el inicio del intervalo de asignación y la otra especifique el final de ese intervalo.
El siguiente comando solicita que se cree una v4-32 en 5 horas y 30 minutos desde la hora actual, a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-timw
- Es el momento en el que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
valid-until-duration
- Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
Solicita un recurso en cola con una secuencia de comandos de inicio
Puedes especificar una secuencia de comandos para que se ejecute en un recurso en cola después de aprovisionarlo. Cuando usas el comando gcloud
, puedes usar las marcas --metadata
o --metadata-from-file
para especificar un comando de secuencia de comandos o un archivo que contenga el código de la secuencia de comandos, respectivamente. Cuando uses curl
, debes incluir el código de secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recurso en cola que ejecutará la secuencia de comandos contenida en startup-script.sh
. En el ejemplo de curl
, se muestra una secuencia de comandos intercalada en el cuerpo JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
validInterval
- Es el tiempo durante el cual la solicitud es válida tras el cual se cancela. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
metadata-from-file
- Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
metadata
- Especifica los metadatos para la solicitud. En este ejemplo, los metadatos son un comando de secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
Solicitar recursos en cola con una red y subred especificadas
Puedes solicitar un recurso en cola especificando la red y la subred a las que deseas conectar tu TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
- Una red de la que formará parte el recurso en cola.
subnetwork
- Es una subred de la que formará parte el recurso en cola.
Borrar una solicitud de recurso en cola
Para borrar una solicitud de recurso en cola y la VM de TPU creada por la solicitud, pasa la marca --force
al comando queued-resource delete
. De lo contrario, debes borrar la VM de TPU antes de borrar la solicitud de recurso en cola. Cuando borras la VM de TPU, la solicitud de recurso en cola pasa al estado SUSPENDED
, después de lo cual la solicitud de recurso en cola puede borrarse.
Los siguientes comandos borran la solicitud de recurso en cola denominada
“my-queued-resource” en el proyecto “my-project”, ubicado en la zona “us-central2-b”. Usa la marca --force
para borrar la VM de TPU y la solicitud de recurso en cola.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- La zona de la Cloud TPU que se borrará.
force
- Borra la VM de TPU y la solicitud de recurso en cola.
Los siguientes comandos borran la solicitud de recurso en cola denominada “my-queued-resource” en el proyecto “my-project” de la zona “us-central2-b”.
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Recuperar información de estado y diagnóstico sobre una solicitud de recurso en cola
Recupera la información de estado y diagnóstico sobre una solicitud de recurso en cola:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Si la solicitud falla, la respuesta contendrá información del error. Para una solicitud que está esperando recursos, el resultado será similar al siguiente:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Enumera las solicitudes de recursos en cola de tu proyecto
Con el siguiente comando, se enumeran las solicitudes de recursos en cola del proyecto “your-project-id”:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Descripciones de las marcas de comandos
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.