Guía del usuario de recursos en cola

Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado está disponible, se asigna a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá asignada a tu proyecto, a menos que la borres o se interrumpa. Solo las VMs Spot de TPU y las TPU interrumpibles son aptas para la interrupción.

Puedes especificar una hora de inicio y finalización opcional en una solicitud de recurso en cola. La hora de inicio especifica la hora más temprana en la que se completará la solicitud. Si no se completa una solicitud en la hora de finalización especificada, esta vencerá. La solicitud permanece en la cola después de que vence.

Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:

WAITING_FOR_RESOURCES
La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya suficientes recursos gratuitos para comenzar a aprovisionar tu solicitud o hasta que transcurra el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes se pueden aprovisionar de inmediato. Si necesitas una capacidad de obtener TPU más confiable, considera comprar una reserva.
PROVISIONING
Se seleccionó la solicitud de la cola y sus recursos se están asignando actualmente.
ACTIVE
Se asignó la solicitud. Cuando las solicitudes de recursos en cola tienen el estado ACTIVE, puedes administrar las VM de TPU como se describe en Administra TPU.
FAILED
No se pudo completar la solicitud, ya sea porque hubo un problema con ella o porque los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en la cola hasta que se borra explícitamente.
SUSPENDING
Se están borrando los recursos asociados con la solicitud.
SUSPENDED
Se borraron los recursos especificados en la solicitud. Cuando una solicitud se encuentra en el estado SUSPENDED, ya no es apta para una asignación adicional.

Requisitos previos

Antes de ejecutar los comandos de esta guía, asegúrate de hacer lo siguiente:

Cómo solicitar un recurso en cola a pedido

Puedes solicitar un recurso en cola a pedido con el comando gcloud compute tpus queued-resources create. Para obtener más información sobre los recursos a pedido, consulta Tipos de cuotas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.

Tamaños predeterminados de porciones para recursos en cola a pedido

Cuando usas la cuota a pedido, debes solicitar un tamaño de porciones menor que el límite predeterminado para el tipo de acelerador que usas. El sistema rechaza las solicitudes que superan los límites predeterminados.

En la siguiente tabla, se muestran los tipos de TPU y sus límites predeterminados asociados.

Tipo de acelerador Límite predeterminado (en cantidad de tensores)
v2 128
v3 128
v4 384
v5 32

Si necesitas porciones de mayor tamaño, comunícate con la asistencia de Cloud TPU para obtener más información.

Solicita un recurso en cola mediante una reserva

Puedes solicitar un recurso en cola mediante una reserva si especificas la marca --reserved en el comando gcloud o guaranteed.reserved=true en la solicitud curl. Para comprar una reserva, comunícate con el equipo de cuentas de Google Cloud.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.

Solicita un recurso en cola de VM Spot de TPU

Una VM Spot es un recurso que se puede interrumpir y asignar a otra carga de trabajo en cualquier momento. Los recursos de VM Spot cuestan menos y es posible que obtengas acceso a los recursos antes en comparación con una solicitud de VM no Spot. Para obtener más información sobre las VMs TPU Spot, consulta Administra las VMs Spot de TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
spot
Es una marca booleana que especifica que el recurso en cola es una VM Spot.

Solicita que se asigne un recurso en cola antes o después de un tiempo especificado

Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recurso en cola. La hora de inicio o la duración de inicio especifica la primera hora en la que se debe completar la solicitud. Si no se completa una solicitud en la hora de finalización especificada o dentro de la duración especificada, la solicitud vencerá. Una vez que la solicitud venció, permanece en la cola, pero ya no es apta para la asignación.

También puedes especificar un intervalo de asignación especificando una hora de inicio o duración, y una hora de finalización o duración.

Consulta Fecha y hora para obtener una lista de los formatos de marca de tiempo y duración compatibles.

Solicita un recurso en cola después de una duración especificada

Puedes especificar la duración después de la cual se debe asignar un recurso con la marca --valid-after-duration. En el siguiente ejemplo, se solicita que se asigne una v4-32 después de seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-after-duration
Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI

Solicita un recurso en cola que venza después de una duración especificada

Puedes especificar durante cuánto tiempo es válida una solicitud de recurso en cola con la marca --valid-until-duration. En el siguiente ejemplo, se solicita una v4-32 que vence si no se completa en seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-duration
Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI

Cómo solicitar un recurso en cola después de un tiempo especificado

Puedes especificar el momento después del cual se debe asignar un recurso con la marca --valid-after-time.

El siguiente comando solicita que se asigne una TPU v4-4096 con la versión de entorno de ejecución tpu-vm-tf-2.16.1-pjrt después de las 9 a.m. del 14 de diciembre de 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-after-time
La hora, después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.

Cómo solicitar un recurso en cola antes del tiempo especificado

Puedes especificar el momento en que se debe asignar el recurso mediante la marca --valid-until-time.

El siguiente comando solicita que se cree una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-time
Es el momento en el que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.

Solicita que se asigne un recurso en cola dentro de un intervalo especificado

Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time, --valid-after-duration, --valid-until-duration y --valid-until-time, siempre que una de ellas especifique el inicio del intervalo de asignación y la otra especifique el final de ese intervalo.

El siguiente comando solicita que se cree una v4-32 en 5 horas y 30 minutos desde la hora actual, a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-timw
Es el momento en el que se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
valid-until-duration
Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.

Solicita un recurso en cola con una secuencia de comandos de inicio

Puedes especificar una secuencia de comandos para que se ejecute en un recurso en cola después de aprovisionarlo. Cuando usas el comando gcloud, puedes usar las marcas --metadata o --metadata-from-file para especificar un comando de secuencia de comandos o un archivo que contenga el código de la secuencia de comandos, respectivamente. Cuando uses curl, debes incluir el código de secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recurso en cola que ejecutará la secuencia de comandos contenida en startup-script.sh. En el ejemplo de curl, se muestra una secuencia de comandos intercalada en el cuerpo JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
validInterval
Es el tiempo durante el cual la solicitud es válida tras el cual se cancela. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
metadata-from-file
Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.
metadata
Especifica los metadatos para la solicitud. En este ejemplo, los metadatos son un comando de secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en cola.

Solicitar recursos en cola con una red y subred especificadas

Puedes solicitar un recurso en cola especificando la red y la subred a las que deseas conectar tu TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se asigna la solicitud de recurso en cola.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Si deseas obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta las versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
Una red de la que formará parte el recurso en cola.
subnetwork
Es una subred de la que formará parte el recurso en cola.

Borrar una solicitud de recurso en cola

Para borrar una solicitud de recurso en cola y la VM de TPU creada por la solicitud, pasa la marca --force al comando queued-resource delete. De lo contrario, debes borrar la VM de TPU antes de borrar la solicitud de recurso en cola. Cuando borras la VM de TPU, la solicitud de recurso en cola pasa al estado SUSPENDED, después de lo cual la solicitud de recurso en cola puede borrarse.

Los siguientes comandos borran la solicitud de recurso en cola denominada “my-queued-resource” en el proyecto “my-project”, ubicado en la zona “us-central2-b”. Usa la marca --force para borrar la VM de TPU y la solicitud de recurso en cola.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
La zona de la Cloud TPU que se borrará.
force
Borra la VM de TPU y la solicitud de recurso en cola.

Los siguientes comandos borran la solicitud de recurso en cola denominada “my-queued-resource” en el proyecto “my-project” de la zona “us-central2-b”.

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Recuperar información de estado y diagnóstico sobre una solicitud de recurso en cola

Recupera la información de estado y diagnóstico sobre una solicitud de recurso en cola:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Si la solicitud falla, la respuesta contendrá información del error. Para una solicitud que está esperando recursos, el resultado será similar al siguiente:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Enumera las solicitudes de recursos en cola de tu proyecto

Con el siguiente comando, se enumeran las solicitudes de recursos en cola del proyecto “your-project-id”:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Descripciones de las marcas de comandos

project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.