Guia do usuário sobre recursos em fila
Os recursos na fila permitem que você solicite recursos do Cloud TPU em fila. Quando você solicita recursos na fila, a solicitação é adicionada a uma fila mantida pelo serviço do Cloud TPU. Quando o recurso solicitado fica disponível, ele é atribuído ao seu projeto do Google Cloud para uso exclusivo imediato. Ele vai permanecer atribuído ao seu projeto, a menos que você o exclua ou ele seja substituído. Somente VMs do Spot e TPUs preemptivas são qualificadas para preempção.
É possível especificar um horário de início e término em uma fila. solicitação de recurso. O horário de início especifica o horário mais cedo em que a solicitação será atendida. Se uma solicitação não tiver sido preenchida até o horário de término especificado, o solicitação expirar. A solicitação permanece na fila após a expiração.
As solicitações de recursos em fila podem estar em um dos seguintes estados:
WAITING_FOR_RESOURCES
- A solicitação passou pela validação inicial e foi adicionada à fila. Ele permanece nesse estado até que haja recursos livres suficientes para começar a provisionar sua solicitação ou o intervalo de alocação expirar. Quando a demanda é alta, nem todas as solicitações podem ser provisionadas imediatamente. Se você precisar de uma disponibilidade mais confiável de TPUs, considere comprar uma reserva.
PROVISIONING
- A solicitação foi selecionada da fila e os recursos dela estão sendo alocados.
ACTIVE
- A solicitação foi alocada. Quando as solicitações de recursos enfileiradas estiverem no estado
ACTIVE
, você poderá gerenciar as VMs da TPU conforme descrito em Gerenciar TPUs. FAILED
- A solicitação não foi concluída porque há um problema com a solicitação ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
- Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
- Os recursos especificados na solicitação foram excluídos. Quando uma solicitação
está no estado
SUSPENDED
, ela não está mais qualificada para outra alocação.
Pré-requisitos
Antes de executar os comandos neste guia, verifique se você:
- Instale os componentes Alfa da Google Cloud CLI.
- Ative a API Cloud TPU.
Solicitar um recurso na fila on demand
É possível solicitar um recurso na fila sob demanda usando o comando gcloud compute tpus queued-resources create
. Para mais informações sobre
recursos sob demanda, consulte Tipos de cota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software da Cloud TPU.
Tamanhos de fatia padrão para recursos em fila sob demanda
Ao usar a cota sob demanda, é necessário solicitar um tamanho de fatia menor que o limite padrão do tipo de acelerador que você está usando. Solicitações que excedem o os limites padrão são recusados pelo sistema.
A tabela a seguir mostra os tipos de TPU e os limites padrão associados a eles.
Tipo de acelerador | Limite padrão (em número de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Se você precisar de tamanhos de fatia maiores, entre em contato com o Cloud TPU suporte para obter informações adicionais.
Solicitar um recurso na fila usando uma reserva
É possível solicitar um recurso em fila usando uma reserva especificando a
flag --reserved
no comando gcloud
ou guaranteed.reserved=true
na
solicitação do curl. Para comprar uma reserva, fale com sua equipe de conta do Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de um Cloud TPU reserva.
Solicitar um recurso na fila de VM spot da TPU
Uma VM spot é um recurso que pode ser interrompido e atribuído a outra carga de trabalho a qualquer momento. Recursos da VM spot custam menos e você pode ter acesso aos recursos antes de VM que não é spot. Para mais informações sobre as VMs spot do TPU, consulte Gerenciar VMs spot do TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
spot
- Uma flag booleana que especifica que o recurso na fila é uma VM do Spot.
Solicitar que um recurso na fila seja alocado antes ou depois de um período especificado
É possível especificar um horário de início, horário de término, duração de início ou duração de término opcional em uma solicitação de recurso em fila. O horário de início ou a duração de início especifica o horário mais cedo em que a solicitação pode ser atendida. Se uma solicitação não tiver sido preenchida até o horário de término especificado ou dentro de a duração especificada, a solicitação vai expirar. Depois que a solicitação expirar, ela permanece na fila, mas não está mais qualificado para alocação.
Também é possível especificar um intervalo de alocação especificando o horário de início ou a duração e o horário de término ou duração.
Consulte Data e hora para conferir uma lista de formatos de carimbo de data/hora e duração aceitos.
Solicitar um recurso na fila após um período especificado
É possível especificar um período após o qual um recurso precisa ser alocado usando
a flag --valid-after-duration
. O exemplo a seguir solicita que uma v4-32 seja
alocada após seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho da Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-duration
- O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Datatime do tópico da CLI do Google Cloud
Solicitar um recurso na fila que expira após um período especificado
É possível especificar por quanto tempo uma solicitação de recurso em fila permanece válida usando
a flag --valid-until-duration
. O exemplo a seguir solicita uma instância v4-32 que
expira se não for preenchido em seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Datatime do tópico da CLI do Google Cloud
Solicitar um recurso na fila após um período especificado
É possível especificar um tempo após o qual um recurso precisa ser alocado usando a
flag --valid-after-time
.
O comando a seguir solicita uma TPU v4-4096 com
a versão tpu-vm-tf-2.17.0-pjrt
do ambiente de execução que será alocada após as 9h do dia 14 de dezembro de 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso em fila é alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-time
- Depois desse tempo, o recurso deve ser alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila antes de um período especificado
É possível especificar um horário antes de o recurso ser alocado usando o método
sinalização --valid-until-time
.
O comando a seguir solicita que uma TPU v4-4096 com
a versão do ambiente de execução tpu-vm-tf-2.10.0-pod
seja criada até 14 de dezembro de 2022, às 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho da Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-time
- O tempo após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar que um recurso na fila seja alocado dentro de um intervalo especificado
Use qualquer par de --valid-after-time
para especificar um intervalo de alocação.
as sinalizações --valid-after-duration
, --valid-until-duration
e --valid-until-time
,
desde que uma flag especifique o início do intervalo de alocação e o
other especifica o fim do intervalo de alocação.
O comando a seguir solicita uma versão v4-32 em 5 horas e 30 minutos da horário atual, para ser criado até 14 de dezembro de 2022 às 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software da Cloud TPU.
valid-until-timw
- O tempo após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila com um script de inicialização
É possível especificar um script para ser executado em um recurso em fila depois que ele for
provisionado. Ao usar o comando gcloud
, é possível usar a flag --metadata
ou --metadata-from-file
para especificar um comando de script ou um arquivo que contém
o código do script, respectivamente. Ao usar curl
, é necessário incluir o código
do script no conteúdo JSON. O exemplo a seguir cria um recurso na fila
solicitação que executará o script contido em startup-script.sh
. O curl
mostra um script in-line no corpo JSON.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário à solicitação de recurso em fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho da Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
validInterval
- O tempo em que a solicitação é válida e depois é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
- Especifica um arquivo que contém metadados. Se você não especificar um caminho qualificado para o arquivo de metadados, o comando vai presumir que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso em fila é provisionado.
metadata
- Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.
Solicitar recursos na fila com uma rede e sub-rede especificadas
É possível solicitar um recurso enfileirado especificando a rede e a sub-rede a que você quer conectar a TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho da Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
runtime-version
- A versão do software da Cloud TPU.
reserved
- Use essa flag ao solicitar recursos enfileirados como parte de uma reserva do Cloud TPU.
network
- Uma rede da qual o recurso na fila fará parte.
subnetwork
- Uma sub-rede da qual o recurso na fila vai fazer parte.
Excluir uma solicitação de recurso na fila
É possível excluir uma solicitação de recurso na fila e a VM da TPU criada pela solicitação
transmitindo a sinalização --force
ao comando queued-resource delete
. Caso contrário,
é preciso excluir a VM da TPU antes de excluir a solicitação de recurso na fila. Quando você
exclui a VM de TPU, a solicitação de recurso na fila passa para o
estado SUSPENDED
, após o qual ela pode ser
excluída.
Os comandos a seguir excluem a solicitação de recurso na fila chamada
"my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ela
usa a sinalização --force
para excluir a VM da TPU e o recurso na fila.
solicitação.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona do Cloud TPU a ser excluída.
force
- Exclua a VM da TPU e a solicitação de recurso na fila.
Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso em fila é alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Recuperar informações de estado e diagnósticos sobre uma solicitação de recurso na fila
Extraia o estado e as informações de diagnóstico sobre uma solicitação de recurso na fila:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Se a solicitação falhar, a resposta conterá informações sobre o erro. Para uma solicitação que está aguardando recursos, a saída será semelhante a esta:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Listar solicitações de recursos em fila no seu projeto
O comando a seguir lista as solicitações de recurso na fila do projeto "your-project-id":
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Descrições de sinalizações de comando
project
- O projeto do Google Cloud em que o recurso em fila é alocado.
zone
- A zona em que você planeja criar a Cloud TPU.