Consuma uma reserva

Se tiver uma reserva de TPUs, pode usar os recursos reservados para criar TPUs que correspondam às propriedades da reserva. Esta ação é conhecida como consumir uma reserva. Para obter informações sobre como consumir uma reserva de TPU quando usa o GKE, consulte Reserva de TPU na documentação do GKE.

Consuma uma reserva específica

Quando cria recursos com o comando gcloud alpha compute tpus queued-resources create, use a flag --reservation para especificar o nome da reserva a consumir. Para reservas futuras criadas no modo de calendário, também tem de definir a flag --provisioning-model como reservation-bound:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Substitua as seguintes variáveis de marcadores de posição:

  • QUEUED_RESOURCE_ID: um ID atribuído pelo utilizador para o pedido de recurso em fila.
  • TPU_NAME: um ID (nome) atribuído pelo utilizador para a TPU que é criado quando o pedido de recurso em fila é atribuído.
  • ZONE: a zona na qual criar a VM da TPU. Para mais informações sobre as zonas suportadas, consulte o artigo Regiões e zonas.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho da Cloud TPU a criar. Para mais informações sobre os tipos de aceleradores suportados para cada versão da TPU, consulte Versões da TPU.
  • SOFTWARE_VERSION: a versão do software do Cloud TPU.
  • RESERVATION_URL: o URL da reserva. Especifique um dos seguintes valores:
    • Se a reserva estiver no seu projeto: RESERVATION_NAME
    • Se a reserva estiver noutro projeto e o seu projeto puder consumi-la: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Consumir qualquer reserva correspondente

Pode usar a flag --reserved para determinar automaticamente a reserva a usar com base no tipo de acelerador, no ID do projeto e na zona.

CreateNode

Para consumir qualquer reserva correspondente através da API CreateNode, use o comando gcloud alpha compute tpus tpu-vm create com a flag --reserved:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Substitua as seguintes variáveis de marcadores de posição:

  • TPU_NAME: um nome para a TPU.
  • ZONE: a zona onde criar a VM da TPU, que tem de corresponder à zona de reserva.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho da Cloud TPU a criar. Para mais informações sobre os tipos de aceleradores suportados para cada versão da TPU, consulte Versões da TPU.
  • SOFTWARE_VERSION: a versão do software do Cloud TPU.

Recursos em fila

Para consumir qualquer reserva correspondente através de queued resources, use o gcloud alpha compute tpus queued-resources create comando com a flag --reserved:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Substitua as seguintes variáveis de marcadores de posição:

  • QUEUED_RESOURCE_ID: um ID atribuído pelo utilizador para o pedido de recurso em fila.
  • TPU_NAME: um ID (nome) atribuído pelo utilizador para a TPU que é criado quando o pedido de recurso em fila é atribuído.
  • ZONE: a zona na qual criar a VM da TPU e onde existe a reserva.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho da Cloud TPU a criar. Para mais informações sobre os tipos de aceleradores suportados para cada versão da TPU, consulte Versões da TPU.
  • SOFTWARE_VERSION: a versão do software do Cloud TPU.

Verifique a utilização da reserva

Só pode verificar a utilização de uma reserva partilhada a partir do respetivo projeto proprietário. Se estiver num projeto de consumidor, tem de mudar para o projeto de proprietário para verificar a utilização da reserva.

Para ver a quantidade de armazenamento da reserva que está a ser usada, use o gcloud compute reservations describe comando:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Substitua as seguintes variáveis de marcadores de posição:

  • RESERVATION_NAME: o nome da reserva.
  • PROJECT_ID: o ID do projeto que contém a reserva.
  • ZONE: a zona onde existe a reserva.

Para apresentar uma lista de todas as reservas num projeto, use o comando gcloud compute reservations list:

gcloud compute reservations list --project=PROJECT_ID

Substitua a seguinte variável do marcador de posição:

  • PROJECT_ID: o ID do projeto.

O que se segue?