Se usó la API de Cloud Translation para traducir esta página.

Administra recursos en cola

Los recursos en cola te permiten solicitar recursos de Cloud TPU en colas. Cuando se solicitan recursos en cola, la solicitud se agrega a una cola que mantiene el servicio de Cloud TPU. Cuando el recurso solicitado esté disponible, se asignará a tu proyecto de Google Cloud para tu uso exclusivo inmediato. Permanecerá asignado a tu proyecto, a menos que lo borres o se le quite la prioridad. Solo las VMs Spot de TPU y las TPU interrumpibles son aptas para la preempción.

Puedes especificar una hora de inicio y de finalización opcional en una solicitud de recursos en cola. La hora de inicio especifica la hora más temprana en la que se debe completar la solicitud. Si una solicitud no se completa antes de la hora de finalización especificada, esta vencerá. La solicitud permanece en la cola después de que venza.

Las solicitudes de recursos en cola pueden estar en uno de los siguientes estados:

WAITING_FOR_RESOURCES: La solicitud pasó la validación inicial y se agregó a la cola. Permanece en este estado hasta que haya recursos libres suficientes para comenzar a aprovisionar tu solicitud o hasta que venza el intervalo de asignación. Cuando la demanda es alta, no se pueden aprovisionar todas las solicitudes de inmediato. Si necesitas una disponibilidad más confiable de las TPU, considera comprar una reserva.
Importante: WAITING_FOR_RESOURCES reemplazó el estado ACCEPTED. Si tu código tiene una lógica que espera a que los recursos en fila ingresen al estado ACCEPTED, es posible que debas actualizar el código para que espere el estado WAITING_FOR_RESOURCES.
PROVISIONING: Se seleccionó la solicitud de la cola y se están asignando sus recursos.
ACTIVE: Se asignó la solicitud. Cuando las solicitudes de recursos en cola están en el estado ACTIVE, puedes administrar tus VMs de TPU como se describe en Administra TPUs.
FAILED: No se pudo completar la solicitud, ya sea porque hay un problema con la solicitud o porque los recursos solicitados no estaban disponibles dentro del intervalo de asignación. La solicitud permanece en la fila hasta que se borra de forma explícita.
SUSPENDING: Se están borrando los recursos asociados con la solicitud.
SUSPENDED: Se borraron los recursos especificados en la solicitud. Cuando una solicitud está en el estado SUSPENDED, ya no es apta para una asignación adicional.

Requisitos previos

Antes de ejecutar los comandos de esta guía, debes instalar Google Cloud CLI, crear un proyecto de Google Cloud y habilitar la API de Cloud TPU. Para obtener instrucciones, consulta Configura el entorno de Cloud TPU.

Cómo solicitar un recurso en cola a pedido

No se usurparán los recursos on demand, pero la cuota on demand no garantiza que haya suficientes recursos de Cloud TPU disponibles para satisfacer tu solicitud. Para obtener más información sobre los recursos on demand, consulta Tipos de cuotas.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en cola, ingresa un nombre para tu solicitud de recurso en cola.
Haz clic en Crear para crear la solicitud de recursos en cola.

Tamaños de fragmento predeterminados para recursos en cola según demanda

Cuando usas la cuota on demand, debes solicitar un tamaño de fragmento inferior al límite predeterminado del tipo de acelerador que usas. El sistema rechaza las solicitudes que superan los límites predeterminados.

En la siguiente tabla, se muestran los tipos de TPU y sus límites predeterminados asociados.

Tipo de acelerador	Límite predeterminado (en cantidad de TensorCores)
v2	128
v3	128
v4	384
v5	32

Si necesitas tamaños de porciones más grandes, comunícate con el equipo de asistencia de Cloud TPU para obtener información adicional.

Cómo solicitar un recurso en cola con una reserva

Puedes solicitar un recurso en cola con una reserva. Para comprar una reserva, comunícate con el equipo de cuentas de Google Cloud.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --reserved

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
reserved: Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
reserved: Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en fila, ingresa un nombre para tu solicitud de recurso en fila.
Expande la sección Administración.
Selecciona la casilla de verificación Usar la reserva existente.
Haz clic en Crear para crear la solicitud de recursos en cola.

Solicita un recurso en cola de VM Spot con TPU

Una VM Spot es un recurso que se puede interrumpir y asignar a otra carga de trabajo en cualquier momento. Los recursos de las VM Spot cuestan menos y es posible que obtengas acceso a los recursos antes en comparación con una solicitud de VM que no sea Spot. Para obtener más información sobre las VMs Spot de TPU, consulta Administra VMs Spot de TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.18.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.18.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
spot: Es una marca booleana que especifica que el recurso en cola es una VM Spot.

Solicita que se asigne un recurso en cola antes o después de un horario determinado

Puedes especificar una hora de inicio o una hora de finalización opcional en una solicitud de recursos en cola. La hora de inicio o la duración de inicio especifican la hora más antigua en la que se debe completar la solicitud. La hora de finalización o la duración de finalización especifican por cuánto tiempo la solicitud sigue siendo válida. Si una solicitud no se completa antes de la hora de finalización o dentro de la duración especificada, esta vencerá. Una vez que venza la solicitud, esta permanecerá en la cola, pero ya no será apta para la asignación.

También puedes especificar un intervalo de asignación si especificas una hora de inicio o una duración, y una hora de finalización o una duración.

Para obtener una lista de los formatos de marca de tiempo y duración compatibles, consulta Fecha y hora.

Solicita que se entregue un recurso en fila después de un tiempo especificado

En una solicitud de recursos en cola, puedes especificar una hora o una duración después de la cual se debe asignar un recurso.

gcloud

El siguiente comando solicita una TPU v4-4096 que se asignará después de las 9 a.m. del 14 de diciembre de 2022.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-time 2022-12-14T09:00:00Z

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-after-time: Es la hora después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta gcloud topic datetime.

curl

El siguiente comando solicita una TPU v4-4096 que se asignará después de las 9 a.m. del 14 de diciembre de 2022.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_after_time': {
        'seconds': 2022-12-14T09:00:00Z
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-after-time: Es la hora después de la cual se debe asignar el recurso. Para obtener más información sobre los formatos de duración, consulta gcloud topic datetime.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en fila, ingresa un nombre para tu solicitud de recurso en fila.
En el campo Iniciar solicitud el, ingresa la hora después de la cual se debe asignar el recurso.
Haz clic en Crear para crear la solicitud de recursos en cola.

En el siguiente ejemplo, se solicita que se asigne un v4-32 después de seis horas.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
        --node-id your-node-id \
        --project your-project-id \
        --zone us-central2-b \
        --accelerator-type v4-32 \
        --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
        --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_after_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-after-duration: Es la duración antes de la cual no se debe aprovisionar la TPU. Para obtener más información sobre los formatos de duración, consulta el tema de Google Cloud CLI fecha y hora

Solicita un recurso en cola que vence después de un tiempo especificado

En una solicitud de recursos en cola, puedes especificar durante cuánto tiempo permanece válida. Si la solicitud no se cumple en el tiempo o la duración que especificas, esta vencerá.

gcloud

El siguiente comando solicita una TPU v4-4096. Si la solicitud no se completa antes del 14 de diciembre de 2022 a las 9:00 a.m., vencerá.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-4096 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-time 2022-12-14T09:00:00Z

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-until-time: Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.

curl

El siguiente comando solicita una TPU v4-4096. Si la solicitud no se completa antes del 14 de diciembre de 2022 a las 9:00 a.m., vencerá.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-4096',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
    'queueing_policy': {
    'valid_until_time': {
        'seconds': 1655197200
    }
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-until-time: Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en fila, ingresa un nombre para tu solicitud de recurso en fila.
En el campo Cancelar solicitud el, ingresa la hora en la que vencerá la solicitud de recursos en fila si no se completa.
Haz clic en Crear para crear tu solicitud de recursos en cola.

En el siguiente ejemplo, se solicita un v4-32. La solicitud vencerá si no se completa en seis horas.

gcloud

    gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'valid_until_duration': {
        'seconds': 21600
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-until-duration: Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta el tema de Google Cloud CLI fecha y hora

Solicita que se asigne un recurso en cola dentro de un intervalo especificado

Para especificar un intervalo de asignación, especifica la hora de inicio o la duración, y la hora de finalización o la duración.

gcloud

El siguiente comando solicita una v4-32 en 5 horas y 30 minutos a partir de la hora actual, que se creará a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project-id \
    --zone us-central2-b \
    --accelerator-type v4-32 \
    --runtime-version tpu-vm-tf-2.18.0-pod-pjrt \
    --valid-after-duration 5h30m \
    --valid-until-time 2022-12-14T09:00:00Z

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-until-timw: Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.
valid-until-duration: Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.

curl

El siguiente comando solicita una v4-32 en 5 horas y 30 minutos a partir de la hora actual, que se creará a más tardar el 14 de diciembre de 2022 a las 9:00 a.m.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-32',
        'runtime_version': 'tpu-vm-tf-2.18.0-pod-pjrt',
        }
    }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
valid-until-timw: Es la hora después de la cual se cancela la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.
valid-until-duration: Es la duración de la validez de la solicitud. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de los temas de Google Cloud CLI.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en fila, ingresa un nombre para tu solicitud de recurso en fila.
En el campo Iniciar solicitud el, ingresa la hora después de la cual se debe asignar el recurso.
En el campo Cancelar solicitud el, ingresa la hora en la que vencerá la solicitud de recursos en fila si no se completa.
Haz clic en Crear para crear tu solicitud de recursos en cola.

Solicita un recurso en cola con una secuencia de comandos de inicio

Puedes especificar una secuencia de comandos para que se ejecute en un recurso en cola después de que se aprovisione.

gcloud

Cuando usas el comando gcloud, puedes usar la marca --metadata o --metadata-from-file para especificar un comando de secuencia de comandos o un archivo que contiene el código de la secuencia de comandos, respectivamente. En el siguiente ejemplo, se crea una solicitud de recursos en fila que ejecutará la secuencia de comandos startup-script.sh.

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.12.0 \
    --metadata-from-file='startup-script=startup-script.sh'

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
validInterval: Es el tiempo durante el cual la solicitud es válida y, luego, se cancela. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
metadata-from-file: Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.
metadata: Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son un comando de secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.

curl

Cuando uses curl, debes incluir el código de la secuencia de comandos en el contenido JSON. En el siguiente ejemplo, se incluye una secuencia de comandos intercalada en el cuerpo JSON.

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    tpu: {
        node_spec: {
        parent: 'projects/your-project-number/locations/us-central2-b',
        node_id: 'your-node-id',
        node: {
            accelerator_type: 'v2-8',
            runtime_version: 'tpu-vm-tf-2.18.0-pjrt',
            metadata: {
                "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
            }
        }
        }
    },
'queueing_policy': {
    'validInterval': {
        'startTime': '2022-12-10T14:30:00Z',
        'endTime': '2022-12-14T09:00:00Z'
    }
    },
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID definido por el usuario de la TPU creada en respuesta a la solicitud.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
validInterval: Es el tiempo durante el cual la solicitud es válida y, luego, se cancela. Para obtener más información sobre los formatos de duración, consulta Fecha y hora de temas de Google Cloud CLI.
metadata-from-file: Especifica un archivo que contiene metadatos. Si no especificas una ruta de acceso completamente calificada al archivo de metadatos, el comando supone que se encuentra en el directorio actual. En este ejemplo, el archivo contiene una secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.
metadata: Especifica los metadatos de la solicitud. En este ejemplo, los metadatos son un comando de secuencia de comandos de inicio que se ejecuta cuando se aprovisiona el recurso en fila.

Solicita un recurso en cola con una red y una subred especificadas

En una solicitud de recursos en cola, puedes especificar una red y una subred a las que deseas conectar tu TPU.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
    --node-id your-node-id \
    --project your-project \
    --zone us-central2-b \
    --accelerator-type v4-8 \
    --runtime-version tpu-vm-tf-2.18.0-pjrt \
    --network network-name \
    --subnetwork subnetwork-name

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
reserved: Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network: Una red de la que formará parte el recurso en cola.
subnetwork: Una subred de la que formará parte el recurso en cola.

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
    'tpu': {
    'node_spec': {
        'parent': 'projects/your-project-number/locations/us-central2-b',
        'node_id': 'your-node-id',
        'node': {
        'accelerator_type': 'v4-8',
        'runtime_version': 'tpu-vm-tf-2.18.0-pjrt',
        'network_config': {
            'network': 'network-name',
            'subnetwork': 'subnetwork-name',
            'enable_external_ips': true
        }
    }
    },
    'guaranteed': {
    'reserved': true,
    }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descripciones de los parámetros de comando

queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
node-id: El ID asignado por el usuario de la TPU que se crea cuando se asigna la solicitud de recurso en fila.
project: Tu proyecto de Google Cloud.
zone: Es la zona en la que deseas crear la Cloud TPU.
accelerator-type: El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
runtime-version: La versión del software de Cloud TPU.
reserved: Usa esta marca cuando solicites recursos en cola como parte de una reserva de Cloud TPU.
network: Una red de la que formará parte el recurso en cola.
subnetwork: Una subred de la que formará parte el recurso en cola.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en Crear TPU.
En el campo Nombre, ingresa un nombre para tu TPU.
En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
En el cuadro Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que deseas crear. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el cuadro Versión de software de TPU, selecciona una versión de software. Cuando se crea una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Imágenes de VM de TPU.
Haz clic en el botón de activación Habilitar colas.
En el campo Nombre del recurso en cola, ingresa un nombre para tu solicitud de recurso en cola.
Expande la sección Red.
En los campos Red y Subred, selecciona la red y la subred que deseas usar.
Haz clic en Crear para crear la solicitud de recursos en cola.

Cómo borrar una solicitud de recursos en cola

Para borrar una solicitud de recursos en cola y la TPU asociada con ella, sigue estos pasos:

gcloud

Pasa la marca --force al comando queued-resource delete:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project my-project \
    --zone us-central2-b \
    --force \
    --async

Descripciones de las marcas de comandos

your-queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.
force: Borra la VM de TPU y la solicitud de recursos en cola.

curl

Usa el parámetro de consulta force=true en tu solicitud curl:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/your-queued-resource-id?force=true

Descripciones de las marcas de comandos

your-queued-resource-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.
force: Borra la VM de TPU y la solicitud de recursos en cola.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en la pestaña Recursos en cola.
Selecciona la casilla de verificación junto a tu solicitud de recursos en cola.
Haz clic en Borrar.

Si borras la TPU directamente, también debes borrar el recurso en cola, como se muestra en el siguiente ejemplo. Cuando borras la TPU, la solicitud de recurso en cola cambia al estado SUSPENDED, después del cual se puede borrar.

gcloud

Borra la TPU:

$ gcloud compute tpus tpu-vm delete your-node-id \
    --project=your-project \
    --zone=zone \
    --quiet

Descripciones de las marcas de comandos

project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.
your-node-id: El nombre de la TPU que quieres borrar.

Cuando borras tu TPU, el recurso en cola asociado pasa al estado SUSPENDING y, luego, al estado SUSPENDED. Cuando el recurso en fila está en estado SUSPENDED, puedes borrarlo:

gcloud compute tpus queued-resources delete your-queued-resource-id \
    --project your-project-id \
    --zone us-central2-b

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.

curl

Borra la TPU:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project/locations/us-central2-b/nodes?node_id=your-node-id

Descripciones de las marcas de comandos

project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.
your-node-id: El nombre de la TPU que quieres borrar.

Cuando borras tu TPU, el recurso en cola asociado pasa al estado SUSPENDING y, luego, al estado SUSPENDED. Cuando el recurso en fila está en estado SUSPENDED, puedes borrarlo:

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: La zona de la Cloud TPU que se borrará.

Console

Borra tu TPU:

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Selecciona la casilla de verificación junto a tu TPU.
Haz clic en Borrar.

Cuando borras tu TPU, el recurso en cola asociado pasa al estado Suspending y, luego, al estado Suspended. Cuando el recurso en cola esté en el estado Suspendido, puedes borrarlo:

Haz clic en la pestaña Recursos en cola.
Selecciona la casilla de verificación junto a tu solicitud de recursos en cola.
Haz clic en Borrar.

Cómo recuperar información de estado y diagnóstico sobre una solicitud de recursos en cola

Recupera el estado y la información de diagnóstico de una solicitud de recursos en cola:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
    --project your-project-id \
    --zone us-central2-b

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descripciones de las marcas de comandos

queued-resource-request-id: El ID asignado por el usuario de la solicitud de recursos en cola.
project: Es el ID del proyecto en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en la pestaña Recursos en cola.
Haz clic en el nombre de tu solicitud de recursos en cola.

Después de aprovisionar tu TPU, también puedes ver los detalles de tu solicitud de recurso en cola. Para ello, ve a la página TPUs, busca tu TPU y haz clic en el nombre de la solicitud de recurso en cola correspondiente.

Si la solicitud falla, el resultado contendrá información de error. Para una solicitud que está esperando recursos, el resultado es similar al siguiente:

gcloud

    name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
    state:
    state: WAITING_FOR_RESOURCES
    tpu:
    nodeSpec:
    - node:
        acceleratorType: v4-8
        bootDisk: {}
        networkConfig:
            enableExternalIps: true
        queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
        runtimeVersion: tpu-vm-tf-2.10.0
        schedulingConfig: {}
        serviceAccount: {}
        shieldedInstanceConfig: {}
        useTpuVm: true
        nodeId: your-node-id
        parent: projects/your-project-number/locations/us-central2-b

Console

El campo Queued resource status muestra Waiting for resources.

Enumera las solicitudes de recursos en cola en tu proyecto

Enumera las solicitudes de recursos en cola de tu proyecto:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
    --zone us-central2-b

Descripciones de las marcas de comandos

project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Descripciones de las marcas de comandos

project: El proyecto de Google Cloud en el que se asigna el recurso en cola.
zone: Es la zona en la que deseas crear la Cloud TPU.

Console

En la consola de Google Cloud, ve a la página TPUs:

Ve a TPUs
Haz clic en la pestaña Recursos en cola.