Cotas do Cloud TPU

Neste documento, listamos as cotas que se aplicam ao Cloud TPU. Para informações sobre os preços do Cloud TPU, consulte Preços do Cloud TPU.

Uma cota restringe quanto de um determinado recurso compartilhado do Google Cloud o projeto do Google Cloud pode usar, incluindo hardware, software e componentes de rede. Dessa forma, as cotas fazem parte de um sistema que:

  • monitora o uso ou o consumo de produtos e serviços do Google Cloud;
  • restringe o consumo desses recursos por motivos, que garantem imparcialidade e reduzem picos de uso;
  • mantém as configurações que aplicam automaticamente restrições prescritas;
  • fornece um meio de solicitar ou faz alterações na cota.

Na maioria dos casos, quando uma cota é excedida, o sistema bloqueia imediatamente o acesso ao recurso relevante do Google. Além disso, a tarefa que você está tentando executar falha. Na maioria dos casos, as cotas se aplicam a todos os projetos do Google Cloud. Além disso, elas são compartilhadas entre todos os aplicativos e endereços IP que usam esse projeto.

.

Cota de TPU

Há cotas diferentes para cada versão de TPU. Por exemplo, há diferentes cotas para TPU v2, v3 e assim por diante. Para cada versão de TPU, há diferentes tipos de cota: sob demanda e preemptiva (spot). A tabela a seguir descreve os diferentes tipos de cota.

Tipo da cota Descrição Valor padrão Como solicitar Sinalizações para criação de TPU
Sob demanda O número de recursos sob demanda a que você tem acesso. Sob demanda recursos não serão interrompidos, mas a cota sob demanda não garante que não haja haverá recursos suficientes do Cloud TPU disponíveis para atender à solicitação. v3-8 e v2-8: 16 TensorCores
Todos os outros: 0
Consulte Solicitar cota adicional. Nenhuma sinalização necessária, selecionada por padrão.
Preemptiva O número de recursos preemptivos do Cloud TPU aos quais você tem acesso. Essa cota se aplica a TPUs preemptivas e VMs spot de TPU. Recursos preemptivos podem ser interrompidos para liberar espaço para maior prioridade a outras vagas. A cota preemptiva não garante que haverá disponibilidade suficiente recursos do Cloud TPU para atender à sua solicitação. Para mais informações, consulte TPUs preemptivas e Gerenciar VMs spot de TPU. v3-8 e v2-8: 48 TensorCores
Todos os outros: 0
Consulte Solicitar cota adicional.

As cotas de TPU são especificadas em termos de núcleos de TPU por projeto e por zona ou núcleos de TPU por projeto e por região.

Cotas da TPU v5p

É possível usar a cota de TPU v5p em qualquer combinação de núcleos. Por exemplo, se você tiver cota para 32 núcleos, é possível usá-la para criar quatro frações de TPU cada com 8 núcleos.

Cotas preemptivas:

  • Núcleos de TPU v5p preemptivos por projeto e por região
  • Núcleos de TPU v5p preemptivos por projeto por zona

Cotas sob demanda:

  • Núcleos de TPU v5p por projeto por região
  • Núcleos de TPU v5p por projeto por zona

Cotas da TPU v5e

A TPU v5e pode ser usada para treinamento e disponibilização. Há cotas separadas para treinamento e disponibilização, bem como host único (núcleos lite) e vários hosts (núcleos do pod Lite).

Cotas de veiculação

Cotas de veiculação preemptiva:

  • Núcleos do pod Lite da TPU v5 preemptiva para exibição por projeto por região
  • Núcleos do pod Lite da TPU v5 preemptiva para exibição por projeto por zona

Cotas de veiculação sob demanda:

  • Núcleos do pod da TPU v5 Lite para veiculação por projeto e por região
  • Núcleos do pod da TPU v5 Lite para veiculação por projeto e por zona

Cotas de treinamento

Cotas de treinamento preemptivo:

  • Núcleos preemptivas da TPU v5 Lite por projeto por região
  • Núcleos preemptivos da TPU v5 Lite por projeto por zona
  • Núcleos do pod Lite da TPU v5 preemptiva por projeto por região
  • Núcleos do pod Lite da TPU v5 preemptiva por projeto por zona

Cotas de treinamento sob demanda:

  • Núcleos de TPU v5 Lite por projeto por região
  • Núcleos da TPU v5 Lite por projeto por zona
  • Núcleos do pod da TPU v5 Lite por projeto por região
  • Núcleos do pod da TPU v5 Lite por projeto por zona

Cotas da TPU v4

É possível usar a cota da TPU v4 em qualquer combinação de núcleos. Por exemplo, se você tiver cota para 32 núcleos, é possível usá-la para criar quatro frações de TPU cada com 8 núcleos.

Cotas preemptivas:

  • Núcleos do pod da TPU v4 preemptiva por projeto por região
  • Núcleos do pod da TPU v4 preemptiva por projeto por zona

Cotas sob demanda:

  • Núcleos do pod da TPU v4 por projeto por região
  • Núcleos do pod da TPU v4 por projeto por zona

Cotas da TPU v3

Há cotas separadas de TPU v3 para TPUs de host único (núcleo) e TPUs mulithost (pod). É preciso usar as cotas de pod v3 para criar TPUs com mais de 8 núcleos.

Cotas preemptivas:

  • núcleos preemptivos da TPU v3 por projeto por região
  • Núcleos da TPU v3 preemptivos por projeto por zona
  • Núcleos do pod da TPU v3 preemptiva por projeto por região
  • Núcleos do pod da TPU v3 preemptiva por projeto por zona

Cotas sob demanda:

  • núcleos da TPU v3 por projeto por região
  • Núcleos de TPU v3 por projeto por zona
  • Núcleos do pod da TPU v3 por projeto por região
  • Núcleos do pod da TPU v3 por projeto por zona

Cotas da TPU v2

Existem cotas separadas para TPU v2 para TPUs de host único (núcleo) e TPUs de vários hosts (pod).

Cotas preemptivas:

  • núcleos preemptivos da TPU v2 por projeto por região
  • Núcleos preemptivos da TPU v2 por projeto por zona
  • Núcleos do pod da TPU v2 preemptiva por projeto por região
  • Núcleos do pod da TPU v2 preemptiva por projeto por zona

Cotas sob demanda:

  • núcleos da TPU v2 por projeto por região
  • Núcleos de TPU v2 por projeto por zona
  • Núcleos do pod da TPU v2 por projeto por região
  • Núcleos do pod da TPU v2 por projeto por zona

Para mais informações sobre chips de TPU e TensorCores, consulte Sistema de TPU do Terraform.

Ver e solicitar cota adicional

É possível consultar a cota alocada para seu projeto do Google Cloud no página "Cotas" no Console do Google Cloud. Se você precisar de uma cota extra do Cloud TPU, é possível solicitá-la em "Cotas" página. Para mais informações, consulte Solicitar uma cota maior máximo.