Quotas de atribuição


Este documento lista as quotas de atribuição que se aplicam ao Compute Engine.

Quotas de atribuição

As quotas de alocação, também conhecidas como quotas de recursos, definem o número de recursos aos quais o seu projeto tem acesso. O Compute Engine aplica quotas de atribuição à utilização de recursos por vários motivos. Por exemplo, as quotas ajudam a proteger a comunidade de utilizadores, impedindo picos inesperados na utilização. Google Cloud

OGoogle Cloud também oferece quotas de avaliação gratuita que oferecem acesso limitado aos projetos para ajudar a explorar Google Cloud com base numa avaliação gratuita.

Nem todos os projetos têm as mesmas quotas. À medida que usa o serviço Google Cloud ao longo do tempo, as suas quotas podem aumentar em conformidade. Se esperar um aumento significativo da utilização, pode pedir proativamente ajustes de quota na página Quotas naGoogle Cloud consola.

Para informações específicas sobre as quotas dos limites de taxa da API Compute Engine, consulte o artigo Quota da API.

Quotas e disponibilidade de recursos

As quotas de atribuição são o número máximo de recursos que pode criar desse tipo de recurso, se esses recursos estiverem disponíveis. As quotas não garantem que os recursos estejam sempre disponíveis. Se um recurso não estiver disponível ou se a região que escolher estiver fora do recurso, não pode criar novos recursos desse tipo, mesmo que tenha quota restante na sua região ou projeto. Por exemplo, ainda pode ter quota para criar endereços IP externos no us-central1, mas pode não haver endereços IP disponíveis nessa região.

Da mesma forma, mesmo que tenha uma quota regional, um recurso pode não estar disponível numa zona específica. Por exemplo, pode ter quota para criar instâncias de VM na região us-central1, mas pode não conseguir criar instâncias de VM na zona us-central1-a se a zona estiver esgotada. Nestes casos, experimente criar o mesmo recurso noutra zona, como us-central1-f. Para saber mais sobre as suas opções se os recursos zonais estiverem esgotados, consulte a documentação sobre a resolução de problemas de disponibilidade de recursos.

Quotas de atribuição

Ao planear as necessidades da instância de VM, deve considerar várias quotas que afetam o número de instâncias de VM que pode criar.

Quotas regionais e globais

As quotas de VMs são geridas ao nível regional. A instância de VM, o grupo de instâncias, as quotas de disco e a CPU podem ser consumidos por qualquer VM na região, independentemente da zona. Por exemplo, a quota de CPU é uma quota regional, pelo que existe um limite e uma contagem de utilização diferentes para cada região. Para iniciar uma instância n2-standard-16 em qualquer zona na região us-central1, precisa de quota suficiente para, pelo menos, 16 CPUs em us-central1.

São necessárias quotas de rede e balanceamento de carga para criar firewalls, balanceadores de carga, redes e VPNs. Estas quotas são quotas globais que não dependem de uma região. Qualquer região pode usar uma quota global. Por exemplo, os endereços IP externos estáticos e em utilização atribuídos a balanceadores de carga e proxies HTTP e HTTPS consomem quotas globais.

Instâncias de VMs

A quota de instâncias de VM é uma quota regional e limita o número de instâncias de VM que podem existir numa determinada região, independentemente de a VM estar em execução. Esta quota é visível na Google Cloud consola na página Quotas. O Compute Engine define automaticamente esta quota como 10 vezes a sua quota de CPU normal. Não precisa de pedir esta quota. Se precisar de quota para mais instâncias de VM, peça mais CPUs, uma vez que ter mais CPUs aumenta a quota de instâncias de VM. A quota aplica-se a VMs em execução e não em execução, bem como a instâncias normais e preemptivas.

  1. Na Google Cloud consola, aceda à página Quotas.

    Aceder a Quotas

  2. Na lista Filtro, selecione as seguintes opções:

    • Para Serviço, selecione API Compute Engine.
    • Para Tipo, selecione Quota.
    • Em Nome, selecione Instâncias de VM.
    • Opcional: para Métrica, selecione qualquer outro nome da quota de CPU ou CPU comprometida que quer filtrar.
  3. Opcional: para ordenar a tabela por região, clique na coluna Dimensões (por exemplo, localização).

  4. Selecione as regiões cuja quota quer alterar.

  5. Clique em Editar.

  6. Preencha o formulário.

  7. Clique em Enviar pedido.

Grupos de instâncias

Para usar grupos de instâncias, tem de ter quota disponível para todos os recursos que o grupo usa (por exemplo, quota de CPU) e quota disponível para o próprio recurso do grupo. Consoante o tipo de grupo que criar, aplicam-se as seguintes quotas de utilização de recursos do grupo:

Tipo de serviço Quota de serviço
Grupo de instâncias geridas regional (multizona) Regional instance group managers
Grupo de instâncias geridas zonal (de uma única zona) Ambas as seguintes situações:
  • Instance group managers
  • Instance groups
Grupo de instâncias não gerido (de zona única) Instance groups
Redimensionador automático regional (multizonas) Regional autoscalers
Redimensionador automático zonal (de zona única) Autoscalers

Quotas de disco

As seguintes quotas de discos persistentes, Hyperdisk e SSDs locais aplicam-se por região:

  • Hyperdisk Balanced Capacity (GB). Esta quota é o tamanho combinado total dos discos Hyperdisk Balanced que pode criar numa região. Na CLI gcloud e na API, esta quota é denominada HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s). Esta quota é a quantidade total de débito que pode aprovisionar para todos os discos equilibrados do Hyperdisk numa zona. Na CLI gcloud e na API, esta quota é denominada HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS. Esta quota é o valor total de IOPS que pode aprovisionar para todos os discos equilibrados do Hyperdisk numa zona. Na CLI gcloud e na API, esta quota é designada por HDB-TOTAL-IOPS.
  • . Esta quota é o tamanho combinado total dos discos Hyperdisk ML que pode criar numa região.Hyperdisk ML Capacity (GB) Na CLI gcloud e na API, esta quota é denominada HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s). Esta quota é a quantidade total de débito que pode aprovisionar para todos os discos Hyperdisk ML numa região. Na CLI gcloud e na API, esta quota é denominada HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB). Esta quota é o tamanho total do disco persistente padrão que pode ser criado numa região. Na CLI gcloud e na API, esta quota é denominada DISKS_TOTAL_GB. Esta quota também se aplica a:
    • Disco persistente padrão regional, mas o disco persistente regional consome o dobro da quota por GiB devido à replicação em duas zonas numa região.
    • Quando opta por preservar os dados do SSD local quando para ou suspende uma VM, é consumida uma quantidade equivalente da quota de disco persistente padrão.
  • Persistent disk SSD (GB). Esta quota é a dimensão total combinada dos volumes de disco persistente com suporte de SSD que podem ser criados numa região. Na CLI gcloud e na API, esta quota é denominada SSD_TOTAL_GB. Esta quota é independente da quota para discos SSD locais. Esta quota aplica-se aos seguintes tipos de discos:

    • Disco persistente SSD zonal e regional
    • Disco persistente equilibrado zonal e regional

    Os volumes de discos persistentes regionais consomem o dobro da quota por GiB devido à replicação em duas zonas numa região.

  • Persistent Disk IOPS. Esta quota é o número total de operações de E/S por segundo para volumes de disco persistente extremo que podem ser criados numa região. Na CLI gcloud e na API, esta quota é designada por PD-EXTREME-TOTAL-PROVISIONED-IOPS. Esta quota é independente da quota de IOPS do Google Cloud Hyperdisk.

  • Local SSD per machine family (GB). Esta quota é o tamanho total combinado dos discos SSD local que pode associar a VMs numa região com base no tipo de máquina de cada VM. O SSD local é um disco rápido e efémero que deve ser usado para trabalhos de processamento, cache local ou com elevada tolerância a falhas, uma vez que o disco não se destina a sobreviver a reinícios da instância de VM.

    Os discos SSD locais são vendidos em incrementos de 375 GiB ou 3 TiB, consoante o tipo de máquina. Também existe um número máximo de discos SSD locais que podem ser associados a uma única VM, consoante o tipo de máquina. O número máximo de discos SSD locais e o tamanho de cada disco SSD local criam um limite na quantidade total de capacidade do disco SSD local que pode atribuir a uma VM. Na CLI gcloud e na API, este limite é designado por quota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Para os tipos de máquinas A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 ultra e G4, não precisa de pedir esta quota, uma vez que os SSDs locais são adicionados automaticamente às VMs criadas através destes tipos de máquinas. No entanto, tem de pedir LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para as outras VMs otimizadas para aceleradores.

Quotas do conjunto de armazenamento

Para a capacidade, os conjuntos de armazenamento Hyperdisk com aprovisionamento de capacidade avançado têm as seguintes quotas, medidas em GB (ou 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): a quantidade total de espaço em disco que pode reservar por região num conjunto de armazenamento equilibrado de hiperdisco com aprovisionamento de capacidade avançado.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): a quantidade total de espaço em disco que pode reservar por região num conjunto de armazenamento de débito do Hyperdisk com aprovisionamento de capacidade avançado.

    • CLI gcloud e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Para o desempenho, os conjuntos de armazenamento Hyperdisk com aprovisionamento de desempenho avançado têm as seguintes quotas:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: O total de IOPS que pode reservar num conjunto de armazenamento equilibrado de hiperdiscos com aprovisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): a taxa de transferência total que pode reservar num conjunto de armazenamento equilibrado do Hyperdisk com aprovisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): a taxa de transferência total que pode reservar num conjunto de armazenamento de taxa de transferência do Hyperdisk com aprovisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Compromisso e quotas de recursos comprometidos

Os descontos de fidelidade (CUDs) ajudam a poupar nos custos de utilização do Compute Engine. Recebe estes descontos comprando um contrato de utilização comprometida (também conhecido como um compromisso). O seu compromisso pode ser um compromisso baseado em recursos (em que se compromete a uma quantidade mínima de utilização) ou um compromisso baseado em gastos (em que se compromete a gastar um valor mínimo num produto ou serviço).

Os compromissos baseados em gastos não requerem quotas, ao passo que os compromissos baseados em recursos sim. Antes de poder comprar um compromisso baseado em recursos para recursos regionais específicos, tem de ter quota disponível nessa região para ambos os seguintes:

  • Compromissos. Os compromissos baseados em recursos são recursos regionais, pelo que tem de ter quota disponível para criar esse recurso regional.

  • Recursos comprometidos (exceto memória). Estes são os recursos que especifica no seu compromisso. Tem de ter quota na região para as SKUs comprometidas de quaisquer vCPUs, GPUs ou discos SSD locais que queira especificar no seu compromisso.

Para mais informações, consulte o artigo Quotas para compromissos e recursos comprometidos.

Limites de quota de CPU

A quota de CPUs é o número total de CPUs virtuais em todas as suas instâncias de VM numa região. As quotas de CPUs aplicam-se a VMs em execução e a reservas de VMs. As VMs preemptivas e as VMs predefinidas consomem esta quota.

Para ajudar a proteger os sistemas do Compute Engine e outros utilizadores, algumas contas e projetos novos também têm uma quota CPUs (All Regions) global. Essa quota aplica-se a todas as regiões e é medida como a soma de todas as suas vCPUs em todas as regiões.

Por exemplo, se tiver 48 vCPUs restantes numa única região, como us-central1, mas apenas 32 vCPUs restantes para a quota de CPUs (All Regions), só pode iniciar 32 vCPUs na região us-central1, mesmo que haja quota restante na região. Isto acontece porque atinge a quota CPU (All Regions) e tem de eliminar as instâncias existentes antes de poder iniciar novas instâncias.

Os tipos de máquinas E2 e N1 partilham um conjunto de quotas de CPU. Salvo indicação em contrário, todos os outros tipos de máquinas têm conjuntos de quotas de CPU únicos e separados.

A tabela seguinte apresenta os nomes das quotas para os tipos de máquinas do Compute Engine. Se a quota não for aplicável ao tipo de máquina, é apresentado o valor N/A para "Não aplicável".

Tipo de máquina Conjunto de quotas Nome da quota da CPU Nome da quota de CPU comprometida
N1 conjunto partilhado CPUS Committed_CPUS
E2 conjunto partilhado CPUS Committed_CPUS
N2 piscina separada N2_CPUS Committed_N2_CPUS
N4 piscina separada CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D piscina separada N2D_CPUS Committed_N2D_CPUS
T2D piscina separada T2D_CPUS Committed_T2D_CPUS
T2A piscina separada T2A_CPUS Não disponível para T2A
Z3 piscina separada CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 piscina separada M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 piscina separada M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 piscina separada M3_CPUS Committed_M3_CPUS
M4 piscina separada CPUS_PER_VM_FAMILY Committed_M4_CPUS
X4 piscina separada CPUS_PER_VM_FAMILY Committed_X4_CPUS
H4D (Pré-visualização) piscina separada CPUS_PER_VM_FAMILY Committed_H4D_CPUS
H3 piscina separada CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 piscina separada C2_CPUS Committed_C2_CPUS
C2D piscina separada C2D_CPUS Committed_C2D_CPUS
C3 piscina separada C3_CPUS Committed_C3_CPUS
C3D piscina separada CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 piscina separada CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A piscina separada CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2* piscina separada A2_CPUS Committed_A2_CPUS
A4X N/A para A4X N/A para A4X N/A para A4X
A4 N/A para A4 N/A para A4 N/A para A4
A3 N/A para A3 N/A para A3 N/A para A3
G4 N/A para G4 N/A para G4 N/A para G4
G2 N/A para G2 N/A para G2 N/A para G2
VMs preemptivas conjunto partilhado PREEMPTIBLE_CPUS Não disponível para VMs preemptivas

*Para criar VMs A2, só precisa de ter as quotas de GPU NVIDIA A100 necessárias. Não precisa de pedir quotas de CPU.

Para criar VMs A4X, A4, A3, G4 e G2, só precisa de ter as quotas de GPU NVIDIA B200, H200, H100, RTX PRO 6000 e L4 necessárias, respetivamente. Não precisa de pedir quotas de CPU.

Quota de GPU

Para garantir que tem GPUs suficientes disponíveis no seu projeto, consulte a página Quotas na Google Cloud consola. Peça um aumento da quota se precisar. As novas contas e projetos têm uma quota de GPU global que se aplica a todas as regiões.

Tal como a quota de CPU virtual, a quota de GPU refere-se ao número total de GPUs virtuais em todas as instâncias de VM numa região. As instâncias em execução e as reservas consomem quotas de GPU. Tem quotas diferentes para criar instâncias padrão, VMs Spot (por exemplo, instâncias preemptíveis), estações de trabalho virtuais ou instâncias que usam utilização comprometida.

Quando pedir uma quota de GPU, peça uma quota para os modelos de GPU que quer criar em cada região. Peça também uma quota global adicional (GPUs (all regions)) para o número total de GPUs de todos os tipos em todas as regiões.

A tabela seguinte apresenta as quotas de GPU disponíveis para cada tipo de máquina.

Tipo de máquina Tipo de GPU Quota padrão Quota alocada Quota de estações de trabalho virtuais Quota preemptiva Quota de estações de trabalho virtuais preemptivas
A4X GB200 Não disponível COMMITTED_NVIDIA_GB200_GPUS Não disponível PREEMPTIBLE_NVIDIA_GB200_GPUS Não disponível
A4 B200 Não disponível COMMITTED_NVIDIA_B200_GPUS Não disponível PREEMPTIBLE_NVIDIA_B200_GPUS Não disponível
A3 Ultra H200 Não disponível COMMITTED_NVIDIA_H200_GPUS Não disponível PREEMPTIBLE_NVIDIA_H200_GPUS Não disponível
A3 Mega H100 GPU_FAMILY:NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS Não disponível PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS Não disponível
A3 Edge e A3 High H100 GPU_FAMILY:NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS Não disponível PREEMPTIBLE_NVIDIA_H100_GPUS Não disponível
A2 Ultra A100 80GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS Não disponível PREEMPTIBLE_NVIDIA_A100_80GB_GPUS Não disponível
A2 Standard A100 40GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS Não disponível PREEMPTIBLE_NVIDIA_A100_GPUS Não disponível
G4 Pré-visualização RTX PRO 6000 GPU_FAMILY:NVIDIA_RTX_PRO_6000 Não disponível Não disponível Não disponível Não disponível
G2 L4 GPU_FAMILY:NVIDIA_L4 COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
N1 V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS Não disponível PREEMPTIBLE_NVIDIA_V100_GPUS Não disponível
N1 P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
N1 P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Quotas preemptivas

Pode pedir quotas preemptivas para Preemptible CPUs, Preemptible GPUs e Preemptible Local SSDs (GB). Estas quotas preemptíveis aplicam-se às CPUs, às GPUs e aos SSDs locais das seguintes VMs:

Se o seu projeto não tiver uma quota preemptível e nunca tiver pedido uma quota preemptível, estes recursos consomem a quota padrão. No entanto, depois de pedir quota preemptível no seu projeto, os recursos aplicáveis só podem consumir quota preemptível e não podem reverter para o consumo de quotas padrão.

Pedir quotas preemptíveis pode ajudar a melhorar a obtenção de quotas através da disponibilização de quotas separadas para recursos temporários. Depois de o Compute Engine lhe conceder uma quota preemptível numa região, todos os recursos aplicáveis consomem automaticamente a quota preemptível. Se esta quota estiver esgotada, tem de pedir uma quota preemptível para esses recursos.

Endereços IP externos

Tem de ter endereços IP externos suficientes para todas as VMs que precisam de ser diretamente acessíveis a partir da Internet pública. A quota de IP regional destina-se à atribuição de endereços IPv4 ou IPv6 a VMs nessa região. Os endereços IP IPv6 usam os mesmos tipos de quotas que os endereços IP IPv4, exceto os endereços estáticos IPv6 externos e internos, que têm os seus próprios tipos de quotas.

A quota de IP global destina-se à atribuição de endereços IPv4 a recursos de rede globais, como balanceadores de carga.

Google Cloud oferece diferentes tipos de endereços IP, consoante as suas necessidades. Para informações sobre os custos, consulte os preços dos endereços IP externos. Para ver informações sobre as especificidades das quotas, consulte o artigo Quotas e limites.

  • Endereços IP estáticos. O número de endereços IPv4 externos regionais estáticos que pode reservar em cada região no seu projeto.
  • Intervalos de endereços IPv6 externos estáticos regionais: o número de intervalos de endereços IPv6 externos estáticos regionais que pode reservar em cada região no seu projeto.
  • Endereços IP estáticos globais: endereços IP externos reservados para os seus recursos que persistem após o reinício da máquina. Pode registar estes endereços nos serviços de DNS e fornecedores de domínios para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.
  • Endereços IP em utilização. O número de endereços IP externos regionais estáticos e efémeros que pode usar no seu projeto em simultâneo.
  • Endereços IP em utilização global. O número de endereços IP externos globais estáticos e efémeros que pode usar no seu projeto em simultâneo.

Implementações de quotas

Ocasionalmente, Google Cloud altera a quota predefinida para recursos e APIs. Estas alterações são implementadas gradualmente. Durante a implementação de uma nova quota predefinida, a quota máxima apresentada na consola pode não refletir a quota máxima real disponível para si. Google Cloud

Por exemplo, suponhamos que Google Cloud altera a quota máxima predefinida para as regras de firewall de 200 para 300 e usa a consola Google Cloud para ver a sua quota. Pode ver a nova quota de 300, embora a sua quota real seja 200 até que a implementação esteja concluída.

Para informações sobre implementações de quotas em curso, consulte os problemas conhecidos. Se não forem descritos problemas, não existem implementações de quotas em curso.

Se estiver em curso uma implementação de quotas e quiser confirmar a quota máxima real disponível para si, use a CLI Google Cloud para verificar a sua quota. Se precisar de mais quota do que aquela a que tem acesso, envie um pedido de ajuste de quota.

O que se segue?