Cotas da Cloud TPU

Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre preços da Cloud TPU, consulte Preços da Cloud TPU.

OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso do Google Cloud para uso no projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, como hardwares, softwares e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud e impedem a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.

Em geral, as cotas se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Para mais informações, consulte a visão geral do Cloud Quotas.

Cota de TPU

As cotas de TPU são limites no número de núcleos do Cloud TPU que podem ser usados com um projetoGoogle Cloud . Cada versão da TPU está associada a uma cota própria. Além disso, cada cota de versão da Cloud TPU é dividida em cota sob demanda e cota preemptiva (ou spot).

Ao criar recursos da Cloud TPU, você cria recursos sob demanda por padrão. É possível criar recursos preemptíveis usando o parâmetro --spot ao criar recursos com o comando gcloud. Para mais informações, consulte Gerenciar recursos de TPU.

Cotas padrão da Cloud TPU

As tabelas a seguir mostram os valores padrão para cota sob demanda e preemptível em cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.

Cotas preemptivas

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 1.536 núcleos Núcleos preemptivos da TPU v6e por projeto por zona
v5p 768 núcleos Núcleos preemptivos da TPU v5p por projeto por zona
v5e 1.536 núcleos Núcleos preemptivos do pod da TPU v5 Lite por projeto e zona
v4 0 núcleos Núcleos preemptivos do pod da TPU v4 por projeto por zona
Pod v3 32 núcleos Núcleos preemptivos do pod da TPU v3 por projeto por zona
v3 120 núcleos Núcleos preemptivos da TPU v3 por projeto por zona
Pod v2 32 núcleos Núcleos preemptivos do pod da TPU v2 por projeto por zona
v2 120 núcleos Núcleos preemptivos da TPU v2 por projeto por zona

Cotas sob demanda

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 512 núcleos Núcleos de TPU v6e por projeto por zona
v5p 128 núcleos Núcleos da TPU v5p por projeto por zona
v5e 512 núcleos Núcleos de pod Lite da TPU v5 por projeto e por zona
v4 0 núcleos Núcleos do pod da TPU v4 por projeto por zona
Pod v3 32 núcleos Núcleos do pod da TPU v3 por projeto por zona
v3 40 núcleos Núcleos da TPU v3 por projeto por zona
Pod v2 32 núcleos Núcleos do pod da TPU v2 por projeto por zona
v2 40 núcleos Núcleos de TPU v2 por projeto por zona

Ver e solicitar cota adicional

É possível conferir a cota alocada para seu projeto Google Cloud na página "Cotas" do Google Cloud console.

É possível solicitar mais cota de Cloud TPU na página "Cotas". Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para mais informações, consulte Solicitar um ajuste de cota. Se você solicitar uma cota abaixo do limite de aprovação automática, sua solicitação será aprovada automaticamente.

Cotas preemptivas

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 núcleos Núcleos preemptivos da TPU v6e por projeto por zona
v5p Todas as zonas: 0 núcleos Núcleos preemptivos da TPU v5p por projeto por zona
v5e
  • us-east5-b: 800 núcleos
  • us-west4-a: 1.600 núcleos
  • us-west4-b: 3.968 núcleos
  • us-west1-c: 576 núcleos
  • us-central1-a: 3.264 núcleos
  • europe-west4-a: 4032 núcleos
Núcleos preemptivos do pod da TPU v5 Lite por projeto e zona
v4 Todas as zonas: 0 núcleos Núcleos preemptivos do pod da TPU v4 por projeto por zona
Pod v3
  • europe-west4-a: 512 núcleos
  • us-east1-d: 320 núcleos
Núcleos preemptivos do pod da TPU v3 por projeto por zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos preemptivos da TPU v3 por projeto por zona
Pod v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos preemptivos do pod da TPU v2 por projeto por zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos preemptivos da TPU v2 por projeto por zona

Cotas sob demanda

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 núcleos Núcleos de TPU v6e por projeto por zona
v5p us-east5-a: 64 núcleos Núcleos da TPU v5p por projeto por zona
v5e Todas as zonas: 64 núcleos Núcleos de pod Lite da TPU v5 por projeto e por zona
v4 Todas as zonas: 0 núcleos Núcleos do pod da TPU v4 por projeto por zona
Pod v3
  • europe-west4-a: 128 núcleos
  • us-east1-d: 64 núcleos
Núcleos do pod da TPU v3 por projeto por zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos da TPU v3 por projeto por zona
Pod v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos do pod da TPU v2 por projeto por zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos de TPU v2 por projeto por zona

Você vai receber um e-mail informando se o pedido de cota foi aprovado ou negado. Os aumentos de cota do serviçoGoogle Cloud acontecem gradualmente. Isso pode resultar em ou lançamentos contínuos em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Quotas não vai refletir o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Ver rollouts em andamento.