Guia do usuário sobre recursos em fila

Os recursos na fila permitem que você solicite recursos do Cloud TPU em fila. Quando você solicita recursos na fila, a solicitação é adicionada a uma fila mantida pelo o serviço do Cloud TPU. Quando o recurso solicitado fica disponível, atribuídos ao seu projeto do Google Cloud para uso exclusivo imediato. Ela vai continuar atribuído ao seu projeto, a menos que você o exclua ou seja interrompido. Somente As VMs spot e as TPUs preemptivas de TPU estão qualificadas para a preempção.

É possível especificar um horário de início e término em uma fila. solicitação de recurso. O horário de início especifica o horário mais cedo para o preenchimento da solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado, o solicitação expirar. A solicitação permanece na fila após expirar.

As solicitações de recursos em fila podem estar em um dos seguintes estados:

WAITING_FOR_RESOURCES
A solicitação passou na validação inicial e foi adicionada à fila. Ele permanece nesse estado até que haja recursos livres suficientes para começar provisionando sua solicitação ou o intervalo de alocação passa. Quando a demanda é alta, nem todas as solicitações podem ser feitas provisionado. Se você precisar de uma capacidade de obtenção mais confiável de TPUs, considere a comprar uma reserva.
PROVISIONING
A solicitação foi selecionada na fila e os recursos dela estão sendo alocados.
ACTIVE
A solicitação foi alocada. Quando as solicitações de recursos na fila estão no ACTIVE, é possível gerenciar suas VMs de TPU conforme descrito em Gerenciar TPUs.
FAILED
Não foi possível concluir a solicitação porque há um problema com a solicitação ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
Os recursos especificados na solicitação foram excluídos. Quando uma solicitação está no estado SUSPENDED, não está mais qualificada para alocação do projeto.

Pré-requisitos

Antes de executar os comandos deste guia, faça o seguinte:

Solicitar um recurso na fila sob demanda

É possível solicitar um recurso na fila sob demanda usando o comando gcloud compute tpus queued-resources create. Para mais informações sobre recursos sob demanda, consulte Tipos de cota.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.

Tamanhos de fração padrão para recursos em fila sob demanda

Quando você usa a cota sob demanda, precisa solicitar um tamanho de fração menor que o limite padrão para o tipo de acelerador usado. Solicitações que excedem o os limites padrão são recusados pelo sistema.

A tabela a seguir mostra os tipos de TPU e os respectivos os limites padrão.

Tipo de acelerador Limite padrão (em número de TensorCores)
v2 128
v3 128
v4 384
v5 32

Se você precisar de tamanhos de fatia maiores, entre em contato com o Cloud TPU suporte para obter informações adicionais.

Solicitar um recurso na fila usando uma reserva

É possível solicitar um recurso na fila usando uma reserva especificando o a sinalização --reserved no comando gcloud ou guaranteed.reserved=true na curl. Para comprar uma reserva, fale com a equipe de conta do Google Cloud.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
reserved
Use esta sinalização ao solicitar recursos na fila como parte de um Cloud TPU reserva.

Solicitar um recurso na fila de VM spot da TPU

Uma VM spot é um recurso que pode ser interrompido e atribuído a outra carga de trabalho a qualquer momento. Recursos da VM spot custam menos e você pode ter acesso aos recursos antes de VM que não é spot. Para mais informações sobre TPU VMs spot, consulte Gerenciar VMs spot de TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
spot
Uma flag booleana que especifica que o recurso na fila é uma VM spot.

Solicitar que um recurso na fila seja alocado antes ou depois de um período especificado

É possível especificar um horário de início opcional, end horário, início duração ou final duração em uma solicitação de recurso na fila. O hora de início ou duração de início especifica o primeiro horário no qual o preenchimento solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado ou dentro de a duração especificada, a solicitação vai expirar. Depois que a solicitação expirar, ela permanece na fila, mas não está mais qualificado para alocação.

Também é possível especificar um intervalo de alocação especificando o horário de início ou a duração e o horário de término ou duração.

Consulte Datetime para um lista de formatos de carimbo de data/hora e duração compatíveis.

Solicitar um recurso na fila após uma duração especificada

É possível especificar uma duração após a qual um recurso deve ser alocado usando a sinalização --valid-after-duration. O exemplo a seguir solicita que um v4-32 seja alocados depois de seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-after-duration
O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
.

Solicitar um recurso na fila que expira após um período especificado

É possível especificar por quanto tempo uma solicitação de recurso na fila permanece válida usando a sinalização --valid-until-duration. O exemplo a seguir solicita uma instância v4-32 que expira se não for preenchido em seis horas.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-duration
O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI
.

Solicitar um recurso na fila após um período especificado

É possível especificar um prazo após o qual um recurso deve ser alocado usando o método sinalização --valid-after-time.

O comando a seguir solicita uma TPU v4-4096 com a versão tpu-vm-tf-2.16.1-pjrt do ambiente de execução que será alocada após as 9h do dia 14 de dezembro de 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-after-time
Depois desse tempo, o recurso deve ser alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar um recurso na fila antes de um período especificado

É possível especificar um horário antes de o recurso ser alocado usando o método sinalização --valid-until-time.

O comando a seguir solicita uma TPU v4-4096 com versão do ambiente de execução tpu-vm-tf-2.10.0-pod criada até 14 de dezembro de 2022 às 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-time
O horário depois que a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar que um recurso na fila seja alocado dentro de um intervalo especificado

Use qualquer par de --valid-after-time para especificar um intervalo de alocação. as sinalizações --valid-after-duration, --valid-until-duration e --valid-until-time, desde que uma flag especifique o início do intervalo de alocação e o other especifica o fim do intervalo de alocação.

O comando a seguir solicita uma versão v4-32 em 5 horas e 30 minutos da horário atual, para ser criado até 14 de dezembro de 2022 às 9h.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
valid-until-timw
O horário depois que a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.

Solicitar um recurso na fila com um script de inicialização

Você pode especificar um script a ser executado em um recurso na fila depois de ter sido provisionado. Ao usar o comando gcloud, é possível usar o --metadata ou --metadata-from-file para especificar um comando de script ou um arquivo contendo o código do script, respectivamente. Ao usar curl, é necessário incluir o script no conteúdo JSON. O exemplo a seguir cria um recurso na fila solicitação que executará o script contido em startup-script.sh. O curl mostra um script in-line no corpo JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
validInterval
O tempo de validade da solicitação depois que ela é cancelado. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
Especifica um arquivo que contém metadados. Se você não especificar um valor caminho qualificado para o arquivo de metadados, o comando presume que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso na fila é provisionado.
metadata
Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.

Solicitar recursos na fila com uma rede e sub-rede especificadas

Você pode solicitar um recurso na fila especificando a rede e a sub-rede que com que você quer conectar a TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrições de parâmetros de comando

queued-resource-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
Seu projeto do Google Cloud.
zone
A zona em que você planeja criar a Cloud TPU.
accelerator-type
O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
A versão do software do Cloud TPU.
reserved
Use esta sinalização ao solicitar recursos na fila como parte de um Cloud TPU reserva.
network
Uma rede da qual o recurso na fila fará parte.
subnetwork
Uma sub-rede da qual o recurso na fila fará parte.

Excluir uma solicitação de recurso na fila

É possível excluir uma solicitação de recurso na fila e a VM da TPU criada pela solicitação transmitindo a sinalização --force ao comando queued-resource delete. Caso contrário, é preciso excluir a VM da TPU antes de excluir a solicitação de recurso na fila. Quando você excluir a VM da TPU, a solicitação de recurso na fila é transferida para Estado SUSPENDED, depois do qual a solicitação de recurso na fila pode ser excluída.

Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ela usa a sinalização --force para excluir a VM da TPU e o recurso na fila. solicitação.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona do Cloud TPU a ser excluída.
force
Exclua a VM da TPU e a solicitação de recurso na fila.

Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.

Recuperar informações de estado e diagnósticos sobre uma solicitação de recurso na fila

Recupere as informações de estado e diagnóstico sobre uma solicitação de recurso na fila:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrições de sinalizações de comando

queued-resource-request-id
O ID atribuído pelo usuário da solicitação de recurso na fila.
project
O ID do projeto em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.

Se a solicitação falhar, a resposta conterá informações sobre o erro. Para uma solicitação que está aguardando recursos, a saída será semelhante a esta:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Listar solicitações de recursos na fila no projeto

O comando a seguir lista as solicitações de recurso na fila do projeto "your-project-id":

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Descrições de sinalizações de comando

project
O projeto do Google Cloud em que o recurso na fila está alocado.
zone
A zona em que você planeja criar a Cloud TPU.