Guía del usuario de recursos en cola
Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado está disponible, se asigna a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá asignado a tu proyecto, a menos que lo borres o se interrumpa. Solo las TPU interrumpibles son aptas para la interrupción.
Puedes especificar una hora de inicio y finalización opcional en una solicitud de recurso en cola. La hora de inicio especifica la hora más temprana en la que se debe completar la solicitud. Si una solicitud no se completó antes de la hora de finalización especificada, la solicitud vencerá. La solicitud permanece en cola después de que venza.
Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:
WAITING_FOR_RESOURCES
- La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya suficientes recursos libres para comenzar a aprovisionar tu solicitud o hasta que transcurra el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes se pueden aprovisionar inmediatamente. Si necesitas una capacidad de obtención de TPU más confiable, considera comprar una reserva.
PROVISIONING
- La solicitud se seleccionó de la cola y se están asignando sus recursos.
ACTIVE
- Se asignó la solicitud. Cuando las solicitudes de recursos en cola están en el estado
ACTIVE
, puedes administrar las VMs de TPU como se describe en Administra las TPU. FAILED
- No se pudo completar la solicitud, ya sea porque hay un problema con ella o porque los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en cola hasta que se borra explícitamente.
SUSPENDING
- Se están borrando los recursos asociados con la solicitud.
SUSPENDED
- Se borraron los recursos especificados en la solicitud. Cuando una solicitud tiene el estado
SUSPENDED
, ya no es apta para la asignación adicional.
Requisitos previos
Antes de ejecutar los comandos de esta guía, asegúrate de realizar lo siguiente:
- Instala los componentes alfa de Google Cloud CLI
- Habilita la API de Cloud TPU
Solicita un recurso en cola a pedido
Puedes solicitar un recurso en cola a pedido con el comando gcloud alpha compute tpus queued-resources create
. Para obtener más información sobre los recursos a pedido, consulta Tipos de cuotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
Tamaños predeterminados de porción para los recursos en cola según demanda
Cuando usas la cuota a pedido, debes solicitar un tamaño de porción inferior al límite predeterminado para el tipo de acelerador que usas. El sistema rechaza las solicitudes que exceden los límites predeterminados.
En la siguiente tabla, se muestran los tipos de TPU y sus límites predeterminados asociados.
Tipo de acelerador | Límite predeterminado (en la cantidad de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si necesitas tamaños de porción más grandes, comunícate con la asistencia de Cloud TPU para obtener más información.
Solicita un recurso en cola con la cuota reservada
Puedes solicitar un recurso en cola con la cuota reservada si especificas la marca --reserved
en el comando gcloud
o guaranteed.reserved=true
en la solicitud curl. Para obtener más información sobre la cuota reservada, consulta Tipos de cuotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
Solicita un recurso interrumpible en cola
Puedes solicitar un recurso interrumpible en cola. Un recurso interrumpible es un recurso que se puede asignar a otra carga de trabajo si otras cargas de trabajo necesitan recursos adicionales. Los recursos interrumpibles son más económicos y es posible que obtengas acceso a los recursos con mayor anticipación en comparación con las solicitudes no interrumpibles. Para obtener más información sobre las cuotas interrumpibles, consulta Tipos de cuotas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
best-effort
- Una marca booleana que especifica que el recurso en cola es interrumpible.
Solicita que se asigne un recurso en cola antes o después de un tiempo especificado
Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recursos en cola. La hora de inicio o la duración del inicio especifican la hora más temprana en la que se debe completar la solicitud. Si una solicitud no se completó antes de la hora de finalización especificada o dentro de la duración especificada, la solicitud vencerá. Una vez que venció la solicitud, permanece en la cola, pero ya no es apta para la asignación.
También puedes especificar un intervalo de asignación si especificas una hora o duración de inicio y una hora de finalización o duración.
Consulta Datetime para obtener una lista de los formatos de marca de tiempo y duración compatibles.
Solicita un recurso en cola después de una duración especificada
Puedes especificar la duración después de la cual se debe asignar un recurso con la marca --valid-after-duration
. En el siguiente ejemplo, se solicita que se asigne una v4-32 después de seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
valid-after-duration
- Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI
Solicita un recurso en cola que venza después de una duración específica
Puedes especificar durante cuánto tiempo permanece válida una solicitud de recursos en cola con la marca --valid-until-duration
. En el siguiente ejemplo, se solicita una v4-32 que
vence si no se completa en seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
valid-until-duration
- Es la duración durante la cual es válida la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI
Solicita un recurso en cola después de un tiempo especificado
Puedes especificar un momento después del cual se debe asignar un recurso con la marca --valid-after-time
.
El siguiente comando solicita que se asigne una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.16.1-pjrt
después de las 9 a.m. del 14 de diciembre de 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
valid-after-time
- La hora y el momento en que se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
Solicita un recurso en cola antes de un tiempo especificado
Puedes especificar una hora antes de la cual se debe asignar el recurso con la marca --valid-until-time
.
El siguiente comando solicita que se cree un nodo TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod
a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
valid-until-time
- El momento en que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
Solicita que se asigne un recurso en cola dentro de un intervalo especificado
Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time
, --valid-after-duration
, --valid-until-duration
y --valid-until-time
, siempre que una marca especifique el comienzo del intervalo de asignación y la otra especifique el final del intervalo de asignación.
El siguiente comando solicita una v4-32 en 5 horas y 30 minutos desde la hora actual, que se creará a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
valid-until-timw
- El momento en que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
valid-until-duration
- Es la duración durante la cual es válida la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
Solicita un recurso en cola con una secuencia de comandos de inicio
Puedes especificar que una secuencia de comandos se ejecute en un recurso en cola después de que se aprovisione. Cuando usas el comando gcloud
, puedes usar las marcas --metadata
o --metadata-from-file
para especificar un comando de secuencia de comandos o un archivo que contenga el código de secuencia de comandos, respectivamente. Cuando usas curl
, debes incluir el código de la secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recursos en cola que ejecutará la secuencia de comandos contenida en startup-script.sh
. En el ejemplo curl
, se muestra una secuencia de comandos intercalada en el cuerpo JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- El ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
validInterval
- El tiempo durante el cual la solicitud es válida y, luego, se cancela. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
metadata-from-file
- Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
metadata
- Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
Solicita recursos en cola con una red y subred especificadas
Puedes solicitar un recurso en cola que especifique la red y la subred a las que deseas conectar tu TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión de software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
- Es una red de la que formará parte el recurso en cola.
subnetwork
- Una subred de la que formará parte el recurso en cola.
Borra una solicitud de recurso en cola
Puedes borrar una solicitud de recurso en cola y la VM de TPU que creó la solicitud si pasas la marca --force
al comando queued-resource delete
. De lo contrario, debes borrar la VM de TPU antes de borrar la solicitud de recursos en cola. Cuando borras la VM de TPU, la solicitud de recursos en cola pasa al estado SUSPENDED
, después de lo cual se puede borrar la solicitud de recursos en cola.
Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource” en el proyecto “my-project” de la zona “us-central2-b”. Usa la marca --force
para borrar la VM de TPU y la solicitud de recursos en cola.
gcloud
gcloud alpha compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- La zona de la Cloud TPU que se borrará.
force
- Borra la VM de TPU y la solicitud de recursos en cola.
Con los siguientes comandos, se borra la solicitud de recurso en cola llamada “my-queued-resource” del proyecto “my-project” en la zona “us-central2-b”.
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Recupera información de estado y diagnóstico sobre una solicitud de recursos en cola
Recupera el estado y la información de diagnóstico sobre una solicitud de recursos en cola:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- El ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Si la solicitud falla, la respuesta contendrá información de error. Para una solicitud que está esperando recursos, el resultado será similar al siguiente:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Obtén una lista de las solicitudes de recursos en cola de tu proyecto
Con el siguiente comando, se enumeran las solicitudes de recursos en cola del proyecto “your-project-id”:
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Descripciones de las marcas de comandos
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.