Guia do usuário sobre recursos na fila
Os recursos em fila permitem solicitar recursos do Cloud TPU em fila. Quando você solicita recursos em fila, a solicitação é adicionada a uma fila mantida pelo serviço do Cloud TPU. Quando o recurso solicitado estiver disponível, ele será atribuído ao seu projeto do Google Cloud para uso exclusivo imediato. Ela permanecerá atribuída ao seu projeto, a menos que você a exclua ou que ela seja interrompida. Somente TPUs preemptivas estão qualificadas para preempção.
Você pode especificar um horário de início e/ou um horário de término opcional em uma solicitação de recurso em fila. O horário de início especifica o primeiro horário para preencher a solicitação. Se uma solicitação não for preenchida até o horário de término especificado, ela vai expirar. A solicitação permanece na fila depois de expirar.
As solicitações de recursos na fila podem estar em um dos seguintes estados:
ACCEPTED
-
A solicitação foi adicionada à fila. Ele permanece nesse estado até
ser alocado ou até o intervalo de alocação expirar. O estado
ACCEPTED
não garante que a solicitação terá cota alocada. Pode levar algum tempo para mudar do statusACCEPTED
paraACTIVE
. PROVISIONING
- A solicitação foi selecionada na fila e os recursos estão sendo alocados.
ACTIVE
- A solicitação foi alocada. Quando as solicitações de recursos em fila estão no estado
ACTIVE
, é possível gerenciar suas VMs de TPU conforme descrito em Gerenciar TPUs. FAILED
- Não foi possível concluir a solicitação porque há um problema com ela ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
- Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
- Os recursos especificados na solicitação foram excluídos. Quando uma solicitação está no estado
SUSPENDED
, ela não está mais qualificada para alocação.
Pré-requisitos
Antes de executar os comandos neste guia, faça o seguinte:
- Instale os componentes Alfa da Google Cloud CLI.
- Ative a API Cloud TPU.
Solicitar um recurso em fila sob demanda
É possível solicitar um recurso na fila sob demanda usando o comando gcloud alpha compute tpus queued-resources create
. Para mais informações sobre
recursos sob demanda, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário que é criado quando a solicitação de recurso em fila é alocada.
project
- Seu projeto do Google Cloud
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
Tamanhos de frações padrão para recursos em fila sob demanda
Ao usar a cota sob demanda, você precisa solicitar um tamanho de fração menor que o limite padrão para o tipo de acelerador que você está usando. As solicitações que excedem os limites padrão são recusadas pelo sistema.
A tabela a seguir mostra os tipos de TPU e os limites padrão associados.
Tipo de acelerador | Limite padrão (em número de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Se você precisar de tamanhos de fatias maiores, entre em contato com o suporte do Cloud TPU para mais informações.
Solicitar um recurso na fila usando uma cota reservada
É possível solicitar um recurso na fila usando a cota reservada. Basta especificar a sinalização --reserved
no comando gcloud
ou guaranteed.reserved=true
na solicitação de curl. Para mais informações sobre cotas reservadas, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário que é criado quando a solicitação de recurso em fila é alocada.
project
- Seu projeto do Google Cloud
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.
Solicitar um recurso na fila preemptiva
É possível solicitar um recurso na fila preemptiva. Um recurso preemptivo é um recurso que pode ser atribuído a outra carga de trabalho se outros forem necessários. Os recursos preemptivas custam menos e é possível que você tenha acesso a recursos mais cedo em comparação com uma solicitação não preemptiva. Para mais informações sobre cotas preemptivas, consulte Tipos de cota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
best-effort
- Uma sinalização booleana especificando que o recurso na fila é preemptiva.
Solicitar que um recurso em fila seja alocado antes ou depois de um período especificado
É possível especificar um horário de início, um horário de término, uma duração de início ou uma duração de término opcionais em uma solicitação de recurso na fila. O horário de início ou a duração de início especifica o primeiro horário para preencher a solicitação. Se uma solicitação não tiver sido preenchida pelo horário de término especificado ou dentro da duração especificada, ela vai expirar. Após a expiração, a solicitação permanece na fila, mas não está mais qualificada para alocação.
Também é possível definir um intervalo de alocação ao determinar um horário de início ou duração e um horário ou duração de término.
Consulte Datetime para ver uma lista de formatos de carimbo de data/hora e duração compatíveis.
Solicitar um recurso em fila após uma duração especificada
É possível especificar um período limite para a alocação de um recurso usando
a sinalização --valid-after-duration
. O exemplo a seguir solicita que uma v4-32 seja
alocada após seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
valid-after-duration
- O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
Solicitar um recurso na fila que expira após uma duração especificada
É possível especificar por quanto tempo uma solicitação de recurso na fila permanece válida usando
a sinalização --valid-until-duration
. O exemplo a seguir solicita uma v4-32 que
expira se não for preenchida em seis horas.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
Solicitar um recurso na fila após um período especificado
É possível especificar um período após o qual um recurso precisa ser alocado usando a
sinalização --valid-after-time
.
O comando a seguir solicita que uma TPU v4-4096 com a versão de ambiente de execução tpu-vm-tf-2.14.0
seja alocada após as 9h de 14 de dezembro de 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
valid-after-time
- Após esse tempo, o recurso precisa ser alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila antes de um horário especificado
É possível especificar um horário antes do qual o recurso precisa ser alocado usando a
sinalização --valid-until-time
.
O comando a seguir solicita que um nó de TPU v4-4096 com a versão de ambiente de execução tpu-vm-tf-2.10.0-pod
seja criado até 14 de dezembro de 2022, às 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
valid-until-time
- Após o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar que um recurso em fila seja alocado em um intervalo especificado
É possível especificar um intervalo de alocação usando qualquer par de sinalizações --valid-after-time
,
--valid-after-duration
, --valid-until-duration
e --valid-until-time
,
desde que uma sinalização especifique o início do intervalo de alocação e a
outra especifique o fim do intervalo.
O comando a seguir solicita uma v4-32 em 5 horas e 30 minutos a partir do horário atual, a ser criada até 14 de dezembro de 2022 às 9h.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
valid-until-timw
- Após o cancelamento da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila com um script de inicialização
É possível especificar um script para ser executado em um recurso na fila depois de ele ter sido provisionado. Ao usar o comando gcloud
, utilize a sinalização --metadata
ou --metadata-from-file
para especificar um comando de script ou um arquivo que contenha o código do script, respectivamente. Ao usar curl
, é necessário incluir o código de script no conteúdo JSON. No exemplo a seguir, criamos uma solicitação de recurso na fila que executará o script contido em startup-script.sh
. O exemplo curl
mostra um script in-line no corpo JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.14.0', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU definido pelo usuário criado em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
validInterval
- O tempo de validade da solicitação após o qual ela é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
- Especifica um arquivo que contém metadados. Se você não especificar um caminho totalmente qualificado para o arquivo de metadados, o comando presumirá que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso na fila é provisionado.
metadata
- Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.
Solicitar um recurso em fila com rede e sub-rede especificadas
É possível solicitar um recurso em fila especificando a rede e a sub-rede a que você quer conectar a TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID da TPU atribuído pelo usuário que é criado quando a solicitação de recurso em fila é alocada.
project
- Seu projeto do Google Cloud
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo do Cloud TPU a ser criado.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de uma reserva do Cloud TPU.
network
- Uma rede da qual o recurso na fila fará parte.
subnetwork
- Uma sub-rede da qual o recurso na fila vai fazer parte.
Excluir uma solicitação de recurso na fila
É possível excluir uma solicitação de recurso na fila e a VM da TPU criada por ela. Basta transmitir a sinalização --force
para o comando queued-resource delete
. Caso contrário, exclua a VM da TPU antes de excluir a solicitação de recurso na fila. Quando a VM da TPU é excluída, a solicitação de recurso em fila passa para o estado SUSPENDED
. Depois disso, a solicitação de recurso em fila pode ser excluída.
Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ele usa a sinalização --force
para excluir a VM da TPU e a solicitação de recurso em fila.
gcloud
gcloud alpha compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona do Cloud TPU a ser excluída.
force
- Exclua a VM da TPU e a solicitação de recurso em fila.
Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Recuperar informações de estado e diagnóstico sobre uma solicitação de recurso na fila
Recupere as informações de estado e de diagnóstico sobre uma solicitação de recurso na fila:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/ us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Se a solicitação falhar, a resposta conterá informações do erro. Para uma solicitação aceita, a saída será semelhante a esta:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: ACCEPTED tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Listar solicitações de recursos em fila no projeto
O comando a seguir lista as solicitações de recursos na fila no projeto "your-project-id":
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Descrições de sinalizações de comando
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.