Quotas do Cloud TPU

Este documento lista as quotas que se aplicam ao Cloud TPU. Para ver informações sobre os preços do Cloud TPU, consulte a secção Preços do Cloud TPU.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema de quotas da nuvem faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Para mais informações, consulte a vista geral das quotas da nuvem.

Quota de TPUs

As quotas de TPUs são limites ao número de núcleos de Cloud TPU que pode usar com um Google Cloud projeto. Cada versão da TPU está associada à sua própria quota. Além disso, a quota de cada versão da Cloud TPU é dividida em quota a pedido e quota preemptível (ou spot).

Quando cria recursos de Cloud TPU, está a criar recursos a pedido por predefinição. Pode criar recursos preemptíveis com o parâmetro --spot quando criar recursos com o comando gcloud. Para mais informações, consulte o artigo Faça a gestão dos recursos da TPU.

Quotas predefinidas do Cloud TPU

As tabelas seguintes mostram os valores predefinidos para a quota a pedido e preemptível para cada zona disponível. Estes valores especificam o número máximo de núcleos de TPU que pode usar no seu projeto.

Quotas preemptivas

Versão da TPU Quota predefinida (número de núcleos) Nome da quota
v6e 1536 núcleos Núcleos de TPU v6e preemptíveis por projeto por zona
v5p 768 núcleos Núcleos de TPU v5p preemptíveis por projeto por zona
v5e 1536 núcleos Núcleos de pods TPU v5 Lite preemptíveis por projeto por zona
v4 0 núcleos Núcleos de pods de TPUs v4 preemptíveis por projeto por zona
v3 pod 32 núcleos Núcleos de pods de TPUs v3 preemptíveis por projeto por zona
v3 120 núcleos Núcleos de TPU v3 preemptíveis por projeto por zona
v2 pod 32 núcleos Núcleos de pods de TPUs v2 preemptíveis por projeto por zona
v2 120 núcleos Núcleos de TPU v2 preemptíveis por projeto por zona

Quotas a pedido

Versão da TPU Quota predefinida (número de núcleos) Nome da quota
v6e 512 núcleos Núcleos de TPU v6e por projeto por zona
v5p 128 núcleos Núcleos da TPU v5p por projeto por zona
v5e 512 núcleos Núcleos do pod TPU v5 lite por projeto por zona
v4 0 núcleos Núcleos do pod de TPU v4 por projeto por zona
v3 pod 32 núcleos Núcleos do pod TPU v3 por projeto por zona
v3 40 núcleos Núcleos da TPU v3 por projeto por zona
v2 pod 32 núcleos Núcleos do pod TPU v2 por projeto por zona
v2 40 núcleos Núcleos da TPU v2 por projeto por zona

Veja e peça quota adicional

Pode ver a quota atribuída ao seu Google Cloud projeto na página Quotas na Google Cloud consola.

Pode pedir quota adicional da Cloud TPU na página Quotas. Encontre a quota que quer aumentar, clique nos três pontos verticais e escolha Editar quota. Para mais informações, consulte o artigo Peça um ajuste da quota. Se pedir uma quota abaixo do limite de aprovação automática, o seu pedido é aprovado automaticamente.

Quotas preemptivas

Versão da TPU Limite de aprovação automática Nome da quota
v6e Todas as zonas: 0 núcleos Núcleos de TPU v6e preemptíveis por projeto por zona
v5p Todas as zonas: 0 núcleos Núcleos de TPU v5p preemptíveis por projeto por zona
v5e
  • us-east5-b: 800 núcleos
  • us-west4-a: 1600 núcleos
  • us-west4-b: 3968 núcleos
  • us-west1-c: 576 núcleos
  • us-central1-a: 3264 núcleos
  • europe-west4-a: 4032 núcleos
Núcleos de pods TPU v5 Lite preemptíveis por projeto por zona
v4 Todas as zonas: 0 núcleos Núcleos de pods de TPUs v4 preemptíveis por projeto por zona
v3 pod
  • europe-west4-a: 512 núcleos
  • us-east1-d: 320 núcleos
Núcleos de pods de TPUs v3 preemptíveis por projeto por zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos de TPU v3 preemptíveis por projeto por zona
v2 pod
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos de pods de TPUs v2 preemptíveis por projeto por zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos de TPU v2 preemptíveis por projeto por zona

Quotas a pedido

Versão da TPU Limite de aprovação automática Nome da quota
v6e Todas as zonas: 0 núcleos Núcleos de TPU v6e por projeto por zona
v5p us-east5-a: 64 núcleos Núcleos da TPU v5p por projeto por zona
v5e Todas as zonas: 64 núcleos Núcleos do pod TPU v5 lite por projeto por zona
v4 Todas as zonas: 0 núcleos Núcleos do pod de TPU v4 por projeto por zona
v3 pod
  • europe-west4-a: 128 núcleos
  • us-east1-d: 64 núcleos
Núcleos do pod TPU v3 por projeto por zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos da TPU v3 por projeto por zona
v2 pod
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos do pod TPU v2 por projeto por zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos da TPU v2 por projeto por zona

Vai receber um email a indicar se o seu pedido de quota foi aprovado ou recusado. Google Cloud Os aumentos da quota de serviço ocorrem gradualmente. Isto pode resultar em implementações contínuas em diferentes regiões ou recursos. Durante a implementação, o valor da quota apresentado na Google Cloud consola ou na API Cloud Quotas não reflete o novo valor da quota aumentado até que a implementação esteja concluída. Para mais informações, consulte o artigo Veja implementações em curso.