Cotas da Cloud TPU
Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre preços da Cloud TPU, consulte Preços da Cloud TPU.
OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso do Google Cloud para uso no projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, como hardwares, softwares e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud e impedem a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
Em geral, as cotas se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Para mais informações, consulte a visão geral do Cloud Quotas.Cota de TPU
As cotas de TPU são limites no número de núcleos do Cloud TPU que podem ser usados com um projetoGoogle Cloud . Cada versão da TPU está associada a uma cota própria. Além disso, cada cota de versão da Cloud TPU é dividida em cota sob demanda e cota preemptiva (ou spot).
Ao criar recursos da Cloud TPU, você cria recursos sob demanda por padrão. É possível criar recursos preemptíveis usando o parâmetro --spot
ao criar recursos com o comando gcloud
. Para mais informações, consulte
Gerenciar recursos de TPU.
Cotas padrão da Cloud TPU
As tabelas a seguir mostram os valores padrão para cota sob demanda e preemptível em cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.
Cotas preemptivas
Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
---|---|---|
v6e | 1.536 núcleos | Núcleos preemptivos da TPU v6e por projeto por zona |
v5p | 768 núcleos | Núcleos preemptivos da TPU v5p por projeto por zona |
v5e | 1.536 núcleos | Núcleos preemptivos do pod da TPU v5 Lite por projeto e zona |
v4 | 0 núcleos | Núcleos preemptivos do pod da TPU v4 por projeto por zona |
Pod v3 | 32 núcleos | Núcleos preemptivos do pod da TPU v3 por projeto por zona |
v3 | 120 núcleos | Núcleos preemptivos da TPU v3 por projeto por zona |
Pod v2 | 32 núcleos | Núcleos preemptivos do pod da TPU v2 por projeto por zona |
v2 | 120 núcleos | Núcleos preemptivos da TPU v2 por projeto por zona |
Cotas sob demanda
Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
---|---|---|
v6e | 512 núcleos | Núcleos de TPU v6e por projeto por zona |
v5p | 128 núcleos | Núcleos da TPU v5p por projeto por zona |
v5e | 512 núcleos | Núcleos de pod Lite da TPU v5 por projeto e por zona |
v4 | 0 núcleos | Núcleos do pod da TPU v4 por projeto por zona |
Pod v3 | 32 núcleos | Núcleos do pod da TPU v3 por projeto por zona |
v3 | 40 núcleos | Núcleos da TPU v3 por projeto por zona |
Pod v2 | 32 núcleos | Núcleos do pod da TPU v2 por projeto por zona |
v2 | 40 núcleos | Núcleos de TPU v2 por projeto por zona |
Ver e solicitar cota adicional
É possível conferir a cota alocada para seu projeto Google Cloud na página "Cotas" do Google Cloud console.
É possível solicitar mais cota de Cloud TPU na página "Cotas". Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para mais informações, consulte Solicitar um ajuste de cota. Se você solicitar uma cota abaixo do limite de aprovação automática, sua solicitação será aprovada automaticamente.
Cotas preemptivas
Versão da TPU | Limite de aprovação automática | Nome da cota |
---|---|---|
v6e | Todas as zonas: 0 núcleos | Núcleos preemptivos da TPU v6e por projeto por zona |
v5p | Todas as zonas: 0 núcleos | Núcleos preemptivos da TPU v5p por projeto por zona |
v5e |
|
Núcleos preemptivos do pod da TPU v5 Lite por projeto e zona |
v4 | Todas as zonas: 0 núcleos | Núcleos preemptivos do pod da TPU v4 por projeto por zona |
Pod v3 |
|
Núcleos preemptivos do pod da TPU v3 por projeto por zona |
v3 |
|
Núcleos preemptivos da TPU v3 por projeto por zona |
Pod v2 |
|
Núcleos preemptivos do pod da TPU v2 por projeto por zona |
v2 |
|
Núcleos preemptivos da TPU v2 por projeto por zona |
Cotas sob demanda
Versão da TPU | Limite de aprovação automática | Nome da cota |
---|---|---|
v6e | Todas as zonas: 0 núcleos | Núcleos de TPU v6e por projeto por zona |
v5p | us-east5-a: 64 núcleos | Núcleos da TPU v5p por projeto por zona |
v5e | Todas as zonas: 64 núcleos | Núcleos de pod Lite da TPU v5 por projeto e por zona |
v4 | Todas as zonas: 0 núcleos | Núcleos do pod da TPU v4 por projeto por zona |
Pod v3 |
|
Núcleos do pod da TPU v3 por projeto por zona |
v3 |
|
Núcleos da TPU v3 por projeto por zona |
Pod v2 |
|
Núcleos do pod da TPU v2 por projeto por zona |
v2 |
|
Núcleos de TPU v2 por projeto por zona |
Você vai receber um e-mail informando se o pedido de cota foi aprovado ou negado. Os aumentos de cota do serviçoGoogle Cloud acontecem gradualmente. Isso pode resultar em ou lançamentos contínuos em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Quotas não vai refletir o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Ver rollouts em andamento.