Guía del usuario de recursos en cola

Los recursos en cola te permiten solicitar recursos de Cloud TPU en cola. Cuando solicitas recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado esté disponible, se asignará a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá a tu proyecto, a menos que lo borres o se interrumpa. Solo las VMs de TPU Spot y las TPU interrumpibles son aptas para la preempción.

Puedes especificar un estado hora de inicio y finalización en una fila solicitud de recursos. La hora de inicio especifica la hora más temprana en la que se completará el la solicitud. Si una solicitud no se completa antes de la hora de finalización especificada, esta vencerá. La solicitud permanece en la cola después de que vence.

Las solicitudes de recursos en cola pueden tener uno de los siguientes estados:

WAITING_FOR_RESOURCES
La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya recursos libres suficientes para comenzar a aprovisionar tu solicitud o hasta que venza el intervalo de asignación. Cuando la demanda es alta, no todas las solicitudes pueden ser inmediatamente o con el que se aprovisionen. Si necesitas una disponibilidad más confiable de las TPU, considera comprar una reserva.
PROVISIONING
Se seleccionó la solicitud de la cola y se están asignando sus recursos.
ACTIVE
Se asignó la solicitud. Cuando las solicitudes de recursos en cola están en el estado ACTIVE, puedes administrar tus VMs de TPU como se describe en Administra TPUs.
FAILED
No se pudo completar la solicitud, ya sea porque ocurrió un problema con el o los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en la cola hasta que se borra explícitamente.
SUSPENDING
Se están borrando los recursos asociados con la solicitud.
SUSPENDED
Se borraron los recursos especificados en la solicitud. Cuando se envía una solicitud está en el estado SUSPENDED, ya no es apto para de asignación.

Requisitos previos

Antes de ejecutar los comandos de esta guía, asegúrate de hacer lo siguiente:

Cómo solicitar un recurso en cola a pedido

Puedes solicitar un recurso en cola de demanda con el comando gcloud compute tpus queued-resources create. Para obtener más información según demanda, consulta Tipos de cuotas.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.

Tamaños de fragmento predeterminados para recursos en cola según demanda

Cuando usas la cuota on demand, debes solicitar un tamaño de fragmento inferior al límite predeterminado del tipo de acelerador que usas. El sistema rechaza las solicitudes que superan los límites predeterminados.

En la siguiente tabla, se muestran los tipos de TPU y sus respectivos con límites predeterminados.

Tipo de acelerador Límite predeterminado (en cantidad de tensores)
v2 128
v3 128
v4 384
v5 32

Si necesitas tamaños de porciones más grandes, comunícate con el equipo de asistencia de Cloud TPU para obtener información adicional.

Cómo solicitar un recurso en cola con una reserva

Puedes solicitar un recurso en cola mediante una reserva especificando La marca --reserved en el comando gcloud o guaranteed.reserved=true en el archivo curl. Para comprar una reserva, comunícate con el equipo de cuentas de Google Cloud.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una Cloud TPU reserva.

Solicita un recurso en cola de VM Spot de TPU

Una VM Spot es un recurso que se puede interrumpir y asignarse a otra carga de trabajo en cualquier momento. Los recursos de las VMs Spot cuestan menos, y es posible que obtengas acceso a los recursos antes en comparación con una solicitud de VM que no sea Spot. Para obtener más información sobre las VMs Spot de TPU, consulta Administra VMs Spot de TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
spot
Es una marca booleana que especifica que el recurso en cola es una VM Spot.

Solicita que se asigne un recurso en cola antes o después de un horario específico

Puedes especificar una hora de inicio, una hora de finalización, una duración de inicio o una duración de finalización opcionales en una solicitud de recursos en cola. El la hora de inicio o la duración de inicio especifica el horario más antiguo en el que se completará el para cada solicitud. Si una solicitud no se completa antes de la hora de finalización especificada o en la duración especificada, se vence la solicitud. Una vez que venza la solicitud, esta permanecerá en la cola, pero ya no será apta para la asignación.

También puedes especificar un intervalo de asignación si especificas una hora de inicio o una duración, y una hora de finalización o una duración.

Consulta Fecha y hora para obtener una lista de los formatos de marca de tiempo y duración compatibles.

Solicita un recurso en cola después de una duración especificada

Puedes especificar una duración después de la cual se debe asignar un recurso con la marca --valid-after-duration. En el siguiente ejemplo, se solicita que se asignen v4-32 después de seis horas.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-after-duration
Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta el tema de Google Cloud CLI fecha y hora

Solicita un recurso en fila que venza después de una duración especificada

Puedes especificar durante cuánto tiempo permanece válida una solicitud de recursos en fila con la marca --valid-until-duration. En el siguiente ejemplo, se solicita un v4-32 que vencerá si no se completa en seis horas.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-duration
Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI

Solicita un recurso en cola después de un tiempo especificado

Puedes especificar un tiempo después del cual se debe asignar un recurso con la marca --valid-after-time.

El siguiente comando solicita una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.17.0-pjrt se asignará después de las 9 a.m. del 14 de diciembre de 2022.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-after-time
Es la hora después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta gcloud topic datetime.

Cómo solicitar un recurso en cola antes de una hora determinada

Puedes especificar un tiempo antes del cual se debe asignar el recurso con la marca --valid-until-time.

El siguiente comando solicita que se cree una TPU v4-4096 con la versión del entorno de ejecución tpu-vm-tf-2.10.0-pod a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recurso en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-time
Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.

Solicita que se asigne un recurso en cola dentro de un intervalo especificado

Puedes especificar un intervalo de asignación con cualquier par de las marcas --valid-after-time, --valid-after-duration, --valid-until-duration y --valid-until-time, siempre que una marca especifique el inicio del intervalo de asignación y la otra especifique el final.

El siguiente comando solicita una v4-32 en 5 horas y 30 minutos al hora actual, a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 5h30m \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
valid-until-timw
Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
valid-until-duration
Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.

Cómo solicitar un recurso en cola con una secuencia de comandos de inicio

Puedes especificar una secuencia de comandos para que se ejecute en un recurso en cola o con el que se aprovisionen. Cuando usas el comando gcloud, puedes usar --metadata o --metadata-from-file para especificar un comando de secuencia de comandos o un archivo que contiene el código de la secuencia de comandos, respectivamente. Cuando uses curl, debes incluir el código de la secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se crea una solicitud de recurso en fila que ejecutará la secuencia de comandos contenida en startup-script.sh. En el ejemplo de curl, se muestra una secuencia de comandos intercalada en el cuerpo JSON.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.12.0 \
  --metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.17.0-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
Es el ID definido por el usuario de la TPU que se creó en respuesta a la solicitud.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
validInterval
El tiempo durante el cual la solicitud es válida tras el cual se cumple cancelado. Para obtener más información sobre los formatos de duración, consulta Fecha y hora del tema de Google Cloud CLI.
metadata-from-file
Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.
metadata
Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son se ejecuta un comando de secuencia de comandos de inicio cuando se aprovisiona el recurso en cola.

Solicitar recursos en cola con una red y subred especificadas

Puedes solicitar un recurso en cola que especifique la red y la subred a las que deseas conectar tu TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --network network-name \
  --subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id
El ID asignado por el usuario de la solicitud de recursos en cola.
node-id
El ID de la TPU asignado por el usuario que se crea cuando se pone en cola se asigna la solicitud del recurso.
project
Tu proyecto de Google Cloud.
zone
Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version
La versión del software de Cloud TPU.
reserved
Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network
Una red de la que formará parte el recurso en cola.
subnetwork
Es una subred de la que formará parte el recurso en cola.

Cómo borrar una solicitud de recursos en cola

Puedes borrar una solicitud de recurso en cola y la VM de TPU creada por la solicitud Pasa la marca --force al comando queued-resource delete. De lo contrario, debes borrar la VM de TPU antes de borrar la solicitud de recurso en cola. Cuando borrar la VM de TPU, la solicitud de recurso en cola pasa a la SUSPENDED, después de lo cual la solicitud de recurso en cola se puede borrar.

Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource” en el proyecto “my-project” en la zona “us-central2-b”. Integra Usa la marca --force para borrar la VM de TPU y el recurso en cola para cada solicitud.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
  --project my-project \
  --zone us-central2-b \
  --force \
  --async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
La zona de la Cloud TPU que se borrará.
force
Borra la VM de TPU y la solicitud de recursos en cola.

Los siguientes comandos borran la solicitud de recurso en cola llamada “my-queued-resource”. en la sección “mi-proyecto” en la zona “us-central2-b”.

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Cómo recuperar información de estado y diagnóstico sobre una solicitud de recursos en cola

Recupera el estado y la información de diagnóstico de una solicitud de recursos en cola:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id
El ID asignado por el usuario de la solicitud de recursos en cola.
project
Es el ID del proyecto en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.

Si la solicitud falla, la respuesta contendrá información del error. Para una solicitud que espera recursos, el resultado se verá similar al siguiente:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Enumera las solicitudes de recursos en cola de tu proyecto

El siguiente comando muestra una lista de las solicitudes de recursos en cola en el proyecto "your-project-id":

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Descripciones de las marcas de comandos

project
El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone
Es la zona en la que deseas crear la Cloud TPU.