Guia do usuário de recursos na fila
Com os recursos na fila, é possível solicitar recursos do Cloud TPU em fila. Quando você solicita recursos na fila, a solicitação é adicionada a uma fila mantida pelo serviço do Cloud TPU. Quando o recurso solicitado ficar disponível, ele será atribuído ao projeto do Google Cloud para uso exclusivo imediato. Ele permanecerá atribuído ao seu projeto, a menos que você o exclua ou seja interrompido. Somente TPUs preemptivas estão qualificadas para preempção.
É possível especificar um horário de início e término opcional em uma solicitação de recurso na fila. O horário de início especifica o primeiro horário para preencher a solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado, ela vai expirar. A solicitação permanece na fila depois de expirar.
As solicitações de recursos na fila podem estar em um dos seguintes estados:
WAITING_FOR_RESOURCES
- A solicitação passou na validação inicial e foi adicionada à fila. Ele permanece nesse estado até que haja recursos livres suficientes para começar a provisionar sua solicitação ou até que o intervalo de alocação termine. Quando a demanda é alta, nem todas as solicitações podem ser provisionadas imediatamente. Se você precisar de uma capacidade de obtenção mais confiável de TPUs, considere comprar uma reserva.
PROVISIONING
- A solicitação foi selecionada na fila e os recursos dela estão sendo alocados.
ACTIVE
- A solicitação foi alocada. Quando as solicitações de recursos em fila estão no estado
ACTIVE
, é possível gerenciar suas VMs de TPU conforme descrito em Gerenciar TPUs. FAILED
- Não foi possível concluir a solicitação porque há um problema com ela ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
- Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
- Os recursos especificados na solicitação foram excluídos. Quando uma solicitação
está no estado
SUSPENDED
, ela não se qualifica mais para outra alocação.
Pré-requisitos
Antes de executar os comandos neste guia, faça o seguinte:
- Instale os componentes Alfa da Google Cloud CLI.
- Ative a API Cloud TPU.
Solicitar um recurso na fila sob demanda
É possível solicitar um recurso na fila sob demanda usando o comando gcloud alpha compute tpus queued-resources create
. Para mais informações sobre recursos sob demanda, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
Tamanhos de frações padrão para recursos enfileirados sob demanda
Quando você usa a cota sob demanda, precisa solicitar um tamanho de fração menor que o limite padrão para o tipo de acelerador que você está usando. As solicitações que excedem os limites padrão são recusadas pelo sistema.
A tabela a seguir mostra os tipos de TPU e os limites padrão associados.
Tipo de acelerador | Limite padrão (em número de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Se você precisar de tamanhos de fatias maiores, entre em contato com o suporte do Cloud TPU para mais informações.
Solicitar um recurso na fila usando a cota reservada
É possível solicitar um recurso na fila usando a cota reservada. Basta especificar a sinalização --reserved
no comando gcloud
ou guaranteed.reserved=true
na solicitação curl. Para mais informações sobre cotas reservadas, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.
Solicitar um recurso na fila preemptiva
É possível solicitar um recurso na fila preemptiva. Um recurso preemptiva pode ser atribuído a outra carga de trabalho se recursos extras forem necessários para outras cargas de trabalho. Os recursos preemptivos custam menos e você pode ter acesso a eles mais cedo do que em uma solicitação não preemptiva. Para mais informações sobre cotas preemptivas, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
best-effort
- Uma sinalização booleana especificando que o recurso na fila é preemptivo.
Solicitar que um recurso na fila seja alocado antes ou depois de um horário especificado
É possível especificar um horário de início, um horário de término, uma duração de início ou uma duração de término opcionais em uma solicitação de recurso na fila. O horário ou a duração de início especificam o primeiro horário para preencher a solicitação. Se uma solicitação não tiver sido preenchida pelo horário de término especificado ou dentro da duração especificada, ela vai expirar. Depois que a solicitação expira, ela permanece na fila, mas não está mais qualificada para alocação.
Também é possível definir um intervalo de alocação com o horário de início ou a duração e o horário de término ou a duração.
Consulte Datetime para conferir uma lista de formatos compatíveis de carimbo de data/hora e duração.
Solicitar um recurso na fila após uma duração especificada
É possível especificar um período após o qual um recurso precisa ser alocado usando
a sinalização --valid-after-duration
. O exemplo a seguir solicita que uma v4-32 seja
alocada após seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-duration
- O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
Solicitar um recurso na fila que expira após uma duração especificada
É possível especificar por quanto tempo uma solicitação de recurso na fila permanece válida usando
a sinalização --valid-until-duration
. O exemplo a seguir solicita uma v4-32 que
expira se não for preenchida em seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
Solicitar um recurso na fila após um tempo especificado
É possível especificar um tempo após o qual um recurso precisa ser alocado usando a
flag --valid-after-time
.
O comando a seguir solicita que uma TPU v4-4096 com
a versão de ambiente de execução tpu-vm-tf-2.16.1-pjrt
seja alocada após as 9h de 14 de dezembro de 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-time
- Depois desse prazo, o recurso será alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila antes de um horário especificado
É possível especificar um horário antes do qual o recurso precisa ser alocado usando a
flag --valid-until-time
.
O comando a seguir solicita que um nó de TPU v4-4096 com
a versão de ambiente de execução tpu-vm-tf-2.10.0-pod
seja criado até 14 de dezembro de 2022, às 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-time
- O horário limite para o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar que um recurso na fila seja alocado em um intervalo especificado
É possível especificar um intervalo de alocação usando qualquer par de sinalizações --valid-after-time
,
--valid-after-duration
, --valid-until-duration
e --valid-until-time
,
desde que uma sinalização especifique o início do intervalo de alocação e a
outra especifique o final dele.
O comando a seguir solicita uma versão v4-32 em 5 horas e 30 minutos a partir do horário atual, para ser criada até 14 de dezembro de 2022, às 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-timw
- O horário limite para o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila com um script de inicialização
É possível especificar um script a ser executado em um recurso na fila depois de ele ter sido provisionado. Ao usar o comando gcloud
, utilize as sinalizações --metadata
ou --metadata-from-file
para especificar um comando de script ou um arquivo que contenha o código do script, respectivamente. Ao usar curl
, você precisa incluir o código de script no conteúdo JSON. O exemplo a seguir cria uma solicitação de recurso na fila que executará o script contido em startup-script.sh
. O exemplo
curl
mostra um script in-line no corpo do JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário, criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
validInterval
- O tempo em que a solicitação é válida e depois que ela é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
- Especifica um arquivo que contém metadados. Se você não especificar um caminho totalmente qualificado para o arquivo de metadados, o comando vai presumir que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso na fila é provisionado.
metadata
- Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.
Solicitar um recurso na fila com uma rede e sub-rede especificadas
É possível solicitar um recurso na fila especificando a rede e a sub-rede a que você quer conectar a TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário, criado quando a solicitação de recurso na fila é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, acesse Versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.
network
- Uma rede da qual o recurso na fila fará parte.
subnetwork
- Uma sub-rede da qual o recurso na fila fará parte.
Excluir uma solicitação de recurso na fila
É possível excluir uma solicitação de recurso na fila e a VM da TPU criada por ela. Basta transmitir a sinalização --force
para o comando queued-resource delete
. Caso contrário, exclua a VM da TPU antes da solicitação de recurso na fila. Quando você exclui a VM da TPU, a solicitação de recurso na fila faz a transição para o estado SUSPENDED
. Depois disso, a solicitação de recurso na fila pode ser excluída.
Os comandos a seguir excluem a solicitação de recurso na fila chamada
"my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ele usa a sinalização --force
para excluir a VM da TPU e a solicitação de recurso na fila.
gcloud
gcloud alpha compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona do Cloud TPU a ser excluída.
force
- Exclua a VM da TPU e a solicitação de recurso na fila.
Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Recuperar informações de estado e diagnóstico sobre uma solicitação de recurso na fila
Recupere as informações de estado e diagnóstico sobre uma solicitação de recurso na fila:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Se a solicitação falhar, a resposta conterá informações do erro. Para uma solicitação que aguarda recursos, a saída será semelhante a esta:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Listar solicitações de recursos na fila do projeto
O comando a seguir lista as solicitações de recursos na fila no projeto "your-project-id":
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Descrições de sinalizações de comando
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.