Guía del usuario de recursos en cola

Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado está disponible, se asigna a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá asignado a tu proyecto, a menos que lo borres o se interrumpa. Solo las TPU interrumpibles son aptas para la interrupción.

Puedes especificar una hora de inicio y finalización opcional en una solicitud de recurso en cola. La hora de inicio especifica la hora más temprana en la que se debe completar la solicitud. Si una solicitud no se completó antes de la hora de finalización especificada, la solicitud vencerá. La solicitud permanece en cola después de que venza.

Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:

WAITING_FOR_RESOURCES
La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya suficientes recursos libres para comenzar a aprovisionar tu solicitud o hasta que transcurra el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes se pueden aprovisionar inmediatamente. Si necesitas una capacidad de obtención de TPU más confiable, considera comprar una reserva.
PROVISIONING
La solicitud se seleccionó de la cola y se están asignando sus recursos.
ACTIVE
Se asignó la solicitud. Cuando las solicitudes de recursos en cola están en el estado ACTIVE, puedes administrar las VMs de TPU como se describe en Administra las TPU.
FAILED
No se pudo completar la solicitud, ya sea porque hay un problema con ella o porque los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en cola hasta que se borra explícitamente.
SUSPENDING
Se están borrando los recursos asociados con la solicitud.
SUSPENDED
Se borraron los recursos especificados en la solicitud. Cuando una solicitud tiene el estado SUSPENDED, ya no es apta para la asignación adicional.

Requisitos previos

Antes de ejecutar los comandos de esta guía, asegúrate de realizar lo siguiente:

Solicita un recurso en cola a pedido

Puedes solicitar un recurso en cola a pedido con el comando gcloud alpha compute tpus queued-resources create. Para obtener más información sobre los recursos a pedido, consulta Tipos de cuotas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.

Tamaños predeterminados de porción para los recursos en cola según demanda

Cuando usas la cuota a pedido, debes solicitar un tamaño de porción inferior al límite predeterminado para el tipo de acelerador que usas. El sistema rechaza las solicitudes que exceden los límites predeterminados.

En la siguiente tabla, se muestran los tipos de TPU y sus límites predeterminados asociados.

Tipo de acelerador Límite predeterminado (en la cantidad de TensorCores)
v2 128
v3 128
v4 384
v5 32

Si necesitas tamaños de porción más grandes, comunícate con la asistencia de Cloud TPU para obtener más información.

Solicita un recurso en cola con la cuota reservada

Puedes solicitar un recurso en cola con la cuota reservada si especificas la marca --reserved en el comando gcloud o guaranteed.reserved=true en la solicitud curl. Para obtener más información sobre la cuota reservada, consulta Tipos de cuotas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.

Solicita un recurso interrumpible en cola

Puedes solicitar un recurso interrumpible en cola. Un recurso interrumpible es un recurso que se puede asignar a otra carga de trabajo si otras cargas de trabajo necesitan recursos adicionales. Los recursos interrumpibles son más económicos y es posible que obtengas acceso a los recursos con mayor anticipación en comparación con las solicitudes no interrumpibles. Para obtener más información sobre las cuotas interrumpibles, consulta Tipos de cuotas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--best-effort

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
best-effort
Una marca booleana que especifica que el recurso en cola es interrumpible.

Solicita que se asigne un recurso en cola antes o después de un tiempo especificado

Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recursos en cola. La hora de inicio o la duración del inicio especifican la hora más temprana en la que se debe completar la solicitud. Si una solicitud no se completó antes de la hora de finalización especificada o dentro de la duración especificada, la solicitud vencerá. Una vez que venció la solicitud, permanece en la cola, pero ya no es apta para la asignación.

También puedes especificar un intervalo de asignación si especificas una hora o duración de inicio y una hora de finalización o duración.

Consulta Datetime para obtener una lista de los formatos de marca de tiempo y duración compatibles.

Solicita un recurso en cola después de una duración especificada

Puedes especificar la duración después de la cual se debe asignar un recurso con la marca --valid-after-duration. En el siguiente ejemplo, se solicita que se asigne una v4-32 después de seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
valid-after-duration
Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI

Solicita un recurso en cola que venza después de una duración específica

Puedes especificar durante cuánto tiempo permanece válida una solicitud de recursos en cola con la marca --valid-until-duration. En el siguiente ejemplo, se solicita una v4-32 que vence si no se completa en seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
valid-until-duration
Es la duración durante la cual es válida la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI

Solicita un recurso en cola después de un tiempo especificado

Puedes especificar un momento después del cual se debe asignar un recurso con la marca --valid-after-time.

El siguiente comando solicita que se asigne una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.16.1-pjrt después de las 9 a.m. del 14 de diciembre de 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
valid-after-time
La hora y el momento en que se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.

Solicita un recurso en cola antes de un tiempo especificado

Puedes especificar una hora antes de la cual se debe asignar el recurso con la marca --valid-until-time.

El siguiente comando solicita que se cree un nodo TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
valid-until-time
El momento en que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.

Solicita que se asigne un recurso en cola dentro de un intervalo especificado

Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time, --valid-after-duration, --valid-until-duration y --valid-until-time, siempre que una marca especifique el comienzo del intervalo de asignación y la otra especifique el final del intervalo de asignación.

El siguiente comando solicita una v4-32 en 5 horas y 30 minutos desde la hora actual, que se creará a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
valid-until-timw
El momento en que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
valid-until-duration
Es la duración durante la cual es válida la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.

Solicita un recurso en cola con una secuencia de comandos de inicio

Puedes especificar que una secuencia de comandos se ejecute en un recurso en cola después de que se aprovisione. Cuando usas el comando gcloud, puedes usar las marcas --metadata o --metadata-from-file para especificar un comando de secuencia de comandos o un archivo que contenga el código de secuencia de comandos, respectivamente. Cuando usas curl, debes incluir el código de la secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recursos en cola que ejecutará la secuencia de comandos contenida en startup-script.sh. En el ejemplo curl, se muestra una secuencia de comandos intercalada en el cuerpo JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
validInterval
El tiempo durante el cual la solicitud es válida y, luego, se cancela. Para obtener más información sobre los formatos de duración, consulta el tema de fecha y hora de Google Cloud CLI.
metadata-from-file
Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
metadata
Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.

Solicita recursos en cola con una red y subred especificadas

Puedes solicitar un recurso en cola que especifique la red y la subred a las que deseas conectar tu TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recursos en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que quieres crear. Si quieres obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión de software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
Es una red de la que formará parte el recurso en cola.
subnetwork
Una subred de la que formará parte el recurso en cola.

Borra una solicitud de recurso en cola

Puedes borrar una solicitud de recurso en cola y la VM de TPU que creó la solicitud si pasas la marca --force al comando queued-resource delete. De lo contrario, debes borrar la VM de TPU antes de borrar la solicitud de recursos en cola. Cuando borras la VM de TPU, la solicitud de recursos en cola pasa al estado SUSPENDED, después de lo cual se puede borrar la solicitud de recursos en cola.

Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource” en el proyecto “my-project” de la zona “us-central2-b”. Usa la marca --force para borrar la VM de TPU y la solicitud de recursos en cola.

gcloud

gcloud alpha compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
La zona de la Cloud TPU que se borrará.
force
Borra la VM de TPU y la solicitud de recursos en cola.

Con los siguientes comandos, se borra la solicitud de recurso en cola llamada “my-queued-resource” del proyecto “my-project” en la zona “us-central2-b”.

gcloud

gcloud alpha compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Recupera información de estado y diagnóstico sobre una solicitud de recursos en cola

Recupera el estado y la información de diagnóstico sobre una solicitud de recursos en cola:

gcloud

gcloud alpha compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
El ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Si la solicitud falla, la respuesta contendrá información de error. Para una solicitud que está esperando recursos, el resultado será similar al siguiente:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Obtén una lista de las solicitudes de recursos en cola de tu proyecto

Con el siguiente comando, se enumeran las solicitudes de recursos en cola del proyecto “your-project-id”:

gcloud

gcloud alpha compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources

Descripciones de las marcas de comandos

project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.