Guia do usuário de recursos na fila

Com os recursos na fila, é possível solicitar recursos do Cloud TPU em fila. Quando você solicita recursos na fila, a solicitação é adicionada a uma fila mantida pelo serviço do Cloud TPU. Quando o recurso solicitado ficar disponível, ele será atribuído ao projeto do Google Cloud para uso exclusivo imediato. Ele permanecerá atribuído ao seu projeto, a menos que você o exclua ou seja interrompido. Somente TPUs preemptivas estão qualificadas para preempção.

É possível especificar um horário de início e término opcional em uma solicitação de recurso na fila. O horário de início especifica o primeiro horário para preencher a solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado, ela vai expirar. A solicitação permanece na fila depois de expirar.

As solicitações de recursos na fila podem estar em um dos seguintes estados:

WAITING_FOR_RESOURCES
A solicitação passou na validação inicial e foi adicionada à fila. Ele permanece nesse estado até que haja recursos livres suficientes para começar a provisionar sua solicitação ou até que o intervalo de alocação termine. Quando a demanda é alta, nem todas as solicitações podem ser provisionadas imediatamente. Se você precisar de uma capacidade de obtenção mais confiável de TPUs, considere comprar uma reserva.
PROVISIONING
A solicitação foi selecionada na fila e os recursos dela estão sendo alocados.
ACTIVE
A solicitação foi alocada. Quando as solicitações de recursos em fila estão no estado ACTIVE, é possível gerenciar suas VMs de TPU conforme descrito em Gerenciar TPUs.
FAILED
Não foi possível concluir a solicitação porque há um problema com ela ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
Os recursos especificados na solicitação foram excluídos. Quando uma solicitação está no estado SUSPENDED, ela não se qualifica mais para outra alocação.

Pré-requisitos

Antes de executar os comandos neste guia, faça o seguinte:

Solicitar um recurso na fila sob demanda

É possível solicitar um recurso na fila sob demanda usando o comando gcloud alpha compute tpus queued-resources create. Para mais informações sobre recursos sob demanda, consulte Tipos de cota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.

Tamanhos de frações padrão para recursos enfileirados sob demanda

Quando você usa a cota sob demanda, precisa solicitar um tamanho de fração menor que o limite padrão para o tipo de acelerador que você está usando. As solicitações que excedem os limites padrão são recusadas pelo sistema.

A tabela a seguir mostra os tipos de TPU e os limites padrão associados.

Tipo de acelerador Limite padrão (em número de TensorCores)
v2 128
v3 128
v4 384
v5 32

Se você precisar de tamanhos de fatias maiores, entre em contato com o suporte do Cloud TPU para mais informações.

Solicitar um recurso na fila usando a cota reservada

É possível solicitar um recurso na fila usando a cota reservada. Basta especificar a sinalização --reserved no comando gcloud ou guaranteed.reserved=true na solicitação curl. Para mais informações sobre cotas reservadas, consulte Tipos de cota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
reserved
Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.

Solicitar um recurso na fila preemptiva

É possível solicitar um recurso na fila preemptiva. Um recurso preemptiva pode ser atribuído a outra carga de trabalho se recursos extras forem necessários para outras cargas de trabalho. Os recursos preemptivos custam menos e você pode ter acesso a eles mais cedo do que em uma solicitação não preemptiva. Para mais informações sobre cotas preemptivas, consulte Tipos de cota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--best-effort

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
best-effort
Uma sinalização booleana especificando que o recurso na fila é preemptivo.

Solicitar que um recurso na fila seja alocado antes ou depois de um horário especificado

É possível especificar um horário de início, um horário de término, uma duração de início ou uma duração de término opcionais em uma solicitação de recurso na fila. O horário ou a duração de início especificam o primeiro horário para preencher a solicitação. Se uma solicitação não tiver sido preenchida pelo horário de término especificado ou dentro da duração especificada, ela vai expirar. Depois que a solicitação expira, ela permanece na fila, mas não está mais qualificada para alocação.

Também é possível definir um intervalo de alocação com o horário de início ou a duração e o horário de término ou a duração.

Consulte Datetime para conferir uma lista de formatos compatíveis de carimbo de data/hora e duração.

Solicitar um recurso na fila após uma duração especificada

É possível especificar um período após o qual um recurso precisa ser alocado usando a sinalização --valid-after-duration. O exemplo a seguir solicita que uma v4-32 seja alocada após seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-after-duration
O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI

Solicitar um recurso na fila que expira após uma duração especificada

É possível especificar por quanto tempo uma solicitação de recurso na fila permanece válida usando a sinalização --valid-until-duration. O exemplo a seguir solicita uma v4-32 que expira se não for preenchida em seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-duration
O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI

Solicitar um recurso na fila após um tempo especificado

É possível especificar um tempo após o qual um recurso precisa ser alocado usando a flag --valid-after-time.

O comando a seguir solicita que uma TPU v4-4096 com a versão de ambiente de execução tpu-vm-tf-2.16.1-pjrt seja alocada após as 9h de 14 de dezembro de 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-after-time
Depois desse prazo, o recurso será alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar um recurso na fila antes de um horário especificado

É possível especificar um horário antes do qual o recurso precisa ser alocado usando a flag --valid-until-time.

O comando a seguir solicita que um nó de TPU v4-4096 com a versão de ambiente de execução tpu-vm-tf-2.10.0-pod seja criado até 14 de dezembro de 2022, às 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-time
O horário limite para o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar que um recurso na fila seja alocado em um intervalo especificado

É possível especificar um intervalo de alocação usando qualquer par de sinalizações --valid-after-time, --valid-after-duration, --valid-until-duration e --valid-until-time, desde que uma sinalização especifique o início do intervalo de alocação e a outra especifique o final dele.

O comando a seguir solicita uma versão v4-32 em 5 horas e 30 minutos a partir do horário atual, para ser criada até 14 de dezembro de 2022, às 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-timw
O horário limite para o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar um recurso na fila com um script de inicialização

É possível especificar um script a ser executado em um recurso na fila depois de ele ter sido provisionado. Ao usar o comando gcloud, utilize as sinalizações --metadata ou --metadata-from-file para especificar um comando de script ou um arquivo que contenha o código do script, respectivamente. Ao usar curl, você precisa incluir o código de script no conteúdo JSON. O exemplo a seguir cria uma solicitação de recurso na fila que executará o script contido em startup-script.sh. O exemplo curl mostra um script in-line no corpo do JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
validInterval
O tempo em que a solicitação é válida e depois que ela é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
Especifica um arquivo que contém metadados. Se você não especificar um caminho totalmente qualificado para o arquivo de metadados, o comando vai presumir que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso na fila é provisionado.
metadata
Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.

Solicitar um recurso na fila com uma rede e sub-rede especificadas

É possível solicitar um recurso na fila especificando a rede e a sub-rede a que você quer conectar a TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
A versão do software do Cloud TPU.
reserved
Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.
network
Uma rede da qual o recurso na fila fará parte.
subnetwork
Uma sub-rede da qual o recurso na fila fará parte.

Excluir uma solicitação de recurso na fila

É possível excluir uma solicitação de recurso na fila e a VM da TPU criada por ela. Basta transmitir a sinalização --force para o comando queued-resource delete. Caso contrário, exclua a VM da TPU antes da solicitação de recurso na fila. Quando você exclui a VM da TPU, a solicitação de recurso na fila faz a transição para o estado SUSPENDED. Depois disso, a solicitação de recurso na fila pode ser excluída.

Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ele usa a sinalização --force para excluir a VM da TPU e a solicitação de recurso na fila.

gcloud

gcloud alpha compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona do Cloud TPU a ser excluída.
force
Exclua a VM da TPU e a solicitação de recurso na fila.

Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".

gcloud

gcloud alpha compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.

Recuperar informações de estado e diagnóstico sobre uma solicitação de recurso na fila

Recupere as informações de estado e diagnóstico sobre uma solicitação de recurso na fila:

gcloud

gcloud alpha compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.

Se a solicitação falhar, a resposta conterá informações do erro. Para uma solicitação que aguarda recursos, a saída será semelhante a esta:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Listar solicitações de recursos na fila do projeto

O comando a seguir lista as solicitações de recursos na fila no projeto "your-project-id":

gcloud

gcloud alpha compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources

Descrições de sinalizações de comando

project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.