Guía del usuario de recursos en cola
Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado esté disponible, se asignará a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá a tu proyecto, a menos que lo borres o se interrumpa. Solo las VMs de TPU Spot y las TPU interrumpibles son aptas para la preempción.
Puedes especificar un estado hora de inicio y finalización en una fila solicitud de recursos. La hora de inicio especifica la hora más temprana en la que se completará el la solicitud. Si una solicitud no se completa antes de la hora de finalización especificada, esta vencerá. La solicitud permanece en la cola después de que vence.
Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:
WAITING_FOR_RESOURCES
- La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya recursos libres suficientes para comenzar a aprovisionar tu solicitud o hasta que venza el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes pueden ser inmediatamente o con el que se aprovisionen. Si necesitas una disponibilidad más confiable de las TPU, considera comprar una reserva.
PROVISIONING
- Se seleccionó la solicitud de la cola y se están asignando sus recursos.
ACTIVE
- Se asignó la solicitud. Cuando las solicitudes de recursos en cola están en el estado
ACTIVE
, puedes administrar tus VMs de TPU como se describe en Administra TPUs. FAILED
- No se pudo completar la solicitud, ya sea porque ocurrió un problema con el o los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en la cola hasta que se borra explícitamente.
SUSPENDING
- Se están borrando los recursos asociados con la solicitud.
SUSPENDED
- Se borraron los recursos especificados en la solicitud. Cuando se envía una solicitud
está en el estado
SUSPENDED
, ya no es apto para de asignación.
Requisitos previos
Antes de ejecutar los comandos de esta guía, asegúrate de hacer lo siguiente:
- Instala los componentes alfa de Google Cloud CLI
- Habilita la API de Cloud TPU
Cómo solicitar un recurso en cola a pedido
Puedes solicitar un recurso en cola de demanda con el comando gcloud compute tpus queued-resources create
. Para obtener más información
según demanda, consulta Tipos de cuotas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
Tamaños de fragmento predeterminados para recursos en cola según demanda
Cuando usas la cuota on demand, debes solicitar un tamaño de fragmento inferior al límite predeterminado del tipo de acelerador que usas. El sistema rechaza las solicitudes que superan los límites predeterminados.
En la siguiente tabla, se muestran los tipos de TPU y sus respectivos con límites predeterminados.
Tipo de acelerador | Límite predeterminado (en cantidad de tensores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Si necesitas tamaños de porciones más grandes, comunícate con el equipo de asistencia de Cloud TPU para obtener información adicional.
Cómo solicitar un recurso en cola con una reserva
Puedes solicitar un recurso en cola mediante una reserva especificando
La marca --reserved
en el comando gcloud
o guaranteed.reserved=true
en el archivo
curl. Para comprar una reserva, comunícate con el equipo de cuentas de Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una Cloud TPU reserva.
Solicita un recurso en cola de VM Spot de TPU
Una VM Spot es un recurso que se puede interrumpir y asignarse a otra carga de trabajo en cualquier momento. Los recursos de las VMs Spot cuestan menos, y es posible que obtengas acceso a los recursos antes en comparación con una solicitud de VM que no sea Spot. Para obtener más información sobre las VMs Spot de TPU, consulta Administra VMs Spot de TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
spot
- Es una marca booleana que especifica que el recurso en cola es una VM Spot.
Solicita que se asigne un recurso en cola antes o después de un horario específico
Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recursos en cola. El la hora de inicio o la duración de inicio especifica el horario más antiguo en el que se completará el para cada solicitud. Si una solicitud no se completa antes de la hora de finalización especificada o en la duración especificada, se vence la solicitud. Una vez que venza la solicitud, esta permanecerá en la cola, pero ya no será apta para la asignación.
También puedes especificar un intervalo de asignación si especificas una hora de inicio o una duración, y una hora de finalización o una duración.
Consulta Fecha y hora para obtener una lista de los formatos de marca de tiempo y duración compatibles.
Solicita un recurso en cola después de una duración especificada
Puedes especificar una duración después de la cual se debe asignar un recurso con la marca --valid-after-duration
. En el siguiente ejemplo, se solicita que se asignen v4-32 después de seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-after-duration
- Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta el tema de Google Cloud CLI fecha y hora
Solicita un recurso en fila que venza después de una duración especificada
Puedes especificar durante cuánto tiempo permanece válida una solicitud de recursos en fila con la marca --valid-until-duration
. En el siguiente ejemplo, se solicita un v4-32 que vencerá si no se completa en seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-duration
- Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI
Solicita un recurso en cola después de un tiempo especificado
Puedes especificar un tiempo después del cual se debe asignar un recurso con la marca --valid-after-time
.
El siguiente comando solicita una TPU v4-4096 con
la versión del entorno de ejecución tpu-vm-tf-2.17.0-pjrt
se asignará después de las 9 a.m. del 14 de diciembre de 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-after-time
- Es la hora después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta gcloud topic datetime.
Cómo solicitar un recurso en cola antes de una hora determinada
Puedes especificar un tiempo antes del cual se debe asignar el recurso con la marca --valid-until-time
.
El siguiente comando solicita que se cree una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod
a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-time
- Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
Solicita que se asigne un recurso en cola dentro de un intervalo especificado
Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time
, --valid-after-duration
, --valid-until-duration
y --valid-until-time
, siempre que una marca especifique el inicio del intervalo de asignación y la otra especifique el final.
El siguiente comando solicita una v4-32 en 5 horas y 30 minutos al hora actual, a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
valid-until-timw
- Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
valid-until-duration
- Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
Cómo solicitar un recurso en cola con una secuencia de comandos de inicio
Puedes especificar una secuencia de comandos para que se ejecute en un recurso en cola
o con el que se aprovisionen. Cuando usas el comando gcloud
, puedes usar --metadata
o --metadata-from-file
para especificar un comando de secuencia de comandos o un archivo que contiene
el código de la secuencia de comandos, respectivamente. Cuando uses curl
, debes incluir el código de la secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recurso en fila que ejecutará la secuencia de comandos contenida en startup-script.sh
. En el ejemplo de curl
, se muestra una secuencia de comandos intercalada en el cuerpo JSON.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
validInterval
- El tiempo durante el cual la solicitud es válida tras el cual se cumple cancelado. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
metadata-from-file
- Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.
metadata
- Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son se ejecuta un comando de secuencia de comandos de inicio cuando se aprovisiona el recurso en cola.
Solicitar recursos en cola con una red y subred especificadas
Puedes solicitar un recurso en cola que especifique la red y la subred a las que deseas conectar tu TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descripciones de los parámetros de comando
queued-resource-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
- El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
- Tu proyecto de Google Cloud.
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
- La versión del software de Cloud TPU.
reserved
- Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
- Una red de la que formará parte el recurso en cola.
subnetwork
- Es una subred de la que formará parte el recurso en cola.
Cómo borrar una solicitud de recursos en cola
Puedes borrar una solicitud de recurso en cola y la VM de TPU creada por la solicitud
Pasa la marca --force
al comando queued-resource delete
. De lo contrario,
debes borrar la VM de TPU antes de borrar la solicitud de recurso en cola. Cuando
borrar la VM de TPU, la solicitud de recurso en cola pasa a la
SUSPENDED
, después de lo cual la solicitud de recurso en cola se puede
borrar.
Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource” en el proyecto “my-project” en la zona “us-central2-b”. Integra
Usa la marca --force
para borrar la VM de TPU y el recurso en cola
para cada solicitud.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- La zona de la Cloud TPU que se borrará.
force
- Borra la VM de TPU y la solicitud de recursos en cola.
Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource”. en la sección “mi-proyecto” en la zona “us-central2-b”.
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Cómo recuperar información de estado y diagnóstico sobre una solicitud de recursos en cola
Recupera el estado y la información de diagnóstico de una solicitud de recursos en cola:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descripciones de las marcas de comandos
queued-resource-request-id
- El ID asignado por el usuario de la solicitud de recursos en cola.
project
- Es el ID del proyecto en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.
Si la solicitud falla, la respuesta contendrá información del error. Para una solicitud que espera recursos, el resultado se verá similar al siguiente:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Enumera las solicitudes de recursos en cola de tu proyecto
El siguiente comando muestra una lista de las solicitudes de recursos en cola en el proyecto "your-project-id":
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Descripciones de las marcas de comandos
project
- El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
- Es la zona en la que deseas crear la Cloud TPU.