cotas de alocação.


Neste documento, listamos as cotas de alocação que se aplicam ao Compute Engine.

cotas de alocação.

As cotas de alocação, também conhecidas como cotas de recursos, definem o número de recursos que seu projeto pode acessar. O Compute Engine aplica cotas no uso de recursos por vários motivos. Por exemplo, as cotas ajudam a proteger a comunidade de usuários do Google Cloud, impedindo picos de uso inesperados. O Google Cloud também oferece cotas de avaliação gratuita que proporcionam acesso limitado a projetos para ajudar você a explorar o funcionamento do Google Cloud por meio de uma avaliação gratuita.

Nem todos os projetos têm as mesmas cotas. Conforme você usa o Google Cloud ao longo do tempo, suas cotas podem aumentar proporcionalmente. Caso espere um aumento de uso significativo, solicite o ajuste das cotas na página Cotas no console do Google Cloud.

Para informações específicas sobre cotas de limites de taxa da API Compute Engine, consulte Cota da API.

Cotas e disponibilidade de recursos

As cotas de alocação são o número máximo de recursos de um tipo específico que você criará, se eles estiverem disponíveis. As cotas não garantem que os recursos estejam sempre disponíveis. Se um recurso não estiver disponível, ou se a região escolhida estiver fora do recurso, não será possível criar novos recursos desse tipo, mesmo que ainda haja cota restante na região ou no projeto. Por exemplo, você ainda pode ter uma cota para criar endereços IP externos em us-central1, mas talvez não haja endereços IP disponíveis nessa região.

Do mesmo modo, mesmo que você tenha cota regional, é possível que um recurso não esteja disponível em uma zona específica. Por exemplo, você tem cota para criar instâncias de VM na região us-central1, mas talvez não consiga criar instâncias de VM na zona us-central1-a se ela estiver esgotada. Nesse caso, tente criar o mesmo recurso em outra zona, como us-central1-f. Para saber mais sobre as opções se os recursos zonais estiverem esgotados, consulte a documentação para resolver problemas de disponibilidade de recursos.

cotas de alocação.

Ao planejar a utilização das instâncias de VM, considere várias cotas que afetam o número de instâncias que podem ser criadas.

Cotas regionais e globais

As cotas de VM são gerenciadas no nível regional. A instância de VM, o grupo de instâncias, as cotas de disco e a CPU podem ser consumidos por qualquer VM na região, independentemente da zona. Por exemplo, a cota da CPU é regional. Sendo assim, o limite e a contagem de uso são diferentes para cada região. Para iniciar uma instância de n2-standard-16 em qualquer zona na região us-central1, você precisa de cota suficiente para pelo menos 16 CPUs em us-central1.

São necessárias cotas de rede e balanceamento de carga para a criação de firewalls, balanceadores de carga, redes e VPNs. Essas cotas são globais que não dependem de uma região. Qualquer região pode usar uma cota global. Por exemplo, os endereços IP externos em uso e estáticos atribuídos a balanceadores de carga e proxies HTTP(S) consomem cotas globais.

Instâncias de VM

A cota de instâncias de VM é uma cota regional que limita o número de instâncias de VM que podem existir em uma determinada região, esteja a VM em execução ou não. Essa cota pode ser visualizada na página Cotas do Console do Google Cloud. O Compute Engine define automaticamente essa cota como dez vezes a cota de CPU normal. Não é necessário solicitar essa cota. Caso você precise de cota para mais instâncias de VM, solicite mais CPUs, porque com mais CPUs a cota de instâncias de VM será maior. A cota se aplica a VMs em execução ou não e a instâncias normais e preemptivas.

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

  2. Clique em Filtrar tabela e selecione Serviço.

  3. Escolha API Compute Engine.

  4. Escolha Cota: instâncias de VM.

  5. Para ver uma lista de cotas da instância de VM por região, clique em Todas as cotas. Suas cotas de região estarão listadas do maior para o menor uso.

  6. Clique na caixa de seleção da região da cota que você quer alterar.

  7. Clique em Editar cotas.

  8. Preencha o formulário.

  9. Clique em Enviar solicitação.

Grupos de instâncias

Para usar grupos de instâncias, é preciso ter uma cota disponível para todos os recursos usados pelo grupo (por exemplo, cota de CPU) e cotas disponíveis para o próprio recurso do grupo. Dependendo do tipo de grupo criado, aplicam-se as cotas de uso de recursos de grupo a seguir:

Tipo de serviço Cota de serviço
Grupo regional de instâncias gerenciadas (várias zonas) Regional instance group managers
Grupo por zona de instâncias gerenciadas (única zona) Ambos:
  • Instance group managers
  • Instance groups
Grupo de instâncias não gerenciadas (única zona) Instance groups
Escalonador automático regional (várias zonas) Regional autoscalers
Escalonador automático de zona (única zona) Autoscalers

Cotas de disco

As cotas de disco permanente e SSD local a seguir aplicam-se por região:

  • Local SSD per machine family (GB). Essa cota é o tamanho total combinado das partições de disco SSD local que podem ser anexadas às VMs em uma região com base no tipo de máquina de cada VM. O SSD local é um disco temporário rápido que pode ser usado como disco de trabalho e para cache local ou processamento de jobs com alta tolerância a falhas. O disco não tem resistência a reinicializações de instâncias de VM. As partições de SSD local são vendidas em incrementos de 375 GB. É possível anexar até 24 partições de SSD local a uma única VM. Na CLI gcloud e na API, essa cota é chamada de LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

  • Persistent disk standard (GB) é a cota que representa o tamanho total dos discos permanentes padrão que podem ser criados em uma região. Conforme descrito em Como otimizar o desempenho de discos permanentes e SSDs locais, os discos permanentes padrão oferecem menor IOPS e capacidade do que os discos permanentes SSD ou SSDs locais. São econômicos quando usados como grandes discos duráveis para armazenamento, como discos de inicialização, e para processos de gravação em série, como registros. Os discos permanentes padrão são duráveis e estão disponíveis indefinidamente para serem anexados a uma VM na mesma zona. Na CLI gcloud e na API, essa cota é chamada de DISKS_TOTAL_GB. Essa cota também se aplica aos discos permanentes padrão regionais. No entanto, discos regionais consomem o dobro da cota por GB, devido à replicação em duas zonas de uma região.

  • Persistent disk SSD (GB) é a cota que representa o tamanho total combinado das partições de Disco permanente SSD que podem ser criadas em uma região. Os discos permanentes SSD têm diversas réplicas e, conforme descrito em Desempenho de armazenamento em blocos, oferecem maior IOPS e capacidade do que discos permanentes padrão. Os discos permanentes SSD estão disponíveis indefinidamente para serem anexados a uma VM na mesma zona. Na CLI gcloud e na API, essa cota é chamada de SSD_TOTAL_GB. Esta cota é separada do SSD local. Essa cota se aplica aos seguintes tipos de disco:

    • Disco permanente SSD regional e por zona.
    • Disco permanente equilibrado regional e por zona.

    Discos permanentes regionais consomem o dobro da cota por GB devido à replicação em duas zonas de uma região.

Limites de cota da CPU

A cota de CPU é o número total de CPUs virtuais em todas as suas instâncias de VM em uma região. As cotas de CPU se aplicam a VMs em execução e reservas de VM. As VMs preemptivas e predefinidas consomem essa cota.

Para proteger os usuários e sistemas do Compute Engine, novas contas e projetos têm, também, uma cota CPUs (All Regions) global que se aplicará a todas as regiões e é medida como a soma de todas as vCPUs em todas as regiões.

Por exemplo, se você tiver 48 vCPUs restantes em uma única região como us-central1, mas apenas 32 vCPUs restantes para a cota de CPUs (All Regions), só é possível iniciar 32 vCPUs na região us-central1, mesmo que haja uma cota maior nessa região. Isso ocorre porque você alcançará a cota de CPU (All Regions) e terá que excluir as instâncias existentes antes de iniciar novas instâncias.

Os tipos de máquina E2 e N1 compartilham um pool de cotas de CPU. A menos que indicado de outra forma, todos os outros tipos de máquina têm pools de cotas de CPU exclusivos e separados.

Se você estiver usando descontos por compromisso de uso para suas VMs, precisará ter cota para esse tipo de benefício antes de comprar um contrato de uso.

Tipo de máquina Pool de cotas Nome da cota de CPU Nome da cota de CPU de uso contínuo
N1 Pool compartilhado CPUS Committed_CPUS
E2 Pool compartilhado CPUS Committed_E2_CPUS
N2 Pool separado N2_CPUS Committed_N2_CPUS
N2D Pool separado N2D_CPUS Committed_N2D_CPUS
T2D Pool separado T2D_CPUS Committed_T2D_CPUS
T2A Pool separado T2A_CPUS Indisponível (N/A) para T2A
Z3 (pré-lançamento) Pool separado CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 Pool separado M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 Pool separado M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 Pool separado M3_CPUS Committed_M3_CPUS
H3 Pool separado CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 Pool separado C2_CPUS Committed_C2_CPUS
C2D Pool separado C2D_CPUS Committed_C2D_CPUS
C3 Pool separado C3_CPUS Committed_C3_CPUS
C3D Pool separado CPUS_PER_VM_FAMILY Committed_C3D_CPUS
VMs preemptivas Pool compartilhado PREEMPTIBLE_CPUS Não disponível (N/A) para VMs preemptivas

Cota de GPU

Assim como acontece com a cota de CPU virtual, a cota de GPU refere-se ao número total de GPUs virtuais em todas as instâncias de VM em uma região. As cotas de GPU se aplicam a VMs em execução e reservas de VM. As VMs preemptivas e predefinidas consomem essa cota.

Verifique a página Cotas para garantir que você tenha GPUs suficientes disponíveis no projeto e para solicitar um aumento de cota. Além disso, novos projetos e contas têm uma cota global de GPU que se aplica a todas as regiões.

Quando você solicita uma cota de GPU, precisa pedir uma cota para os modelos de GPU que você quer criar em cada região e outra cota global (GPUs (all regions)) para o número total de GPUs de todos os tipos em todas as regiões. Solicite a cota de GPU preemptiva para usar esses recursos.

NVIDIA Nome da cota de GPU Nome da cota de GPU de uso contínuo Estação de trabalho virtual GPUs preemptivas Estação de trabalho virtual da GPU preemptiva
H100 80GB NVIDIA_H100_GPUS COMMITTED_NVIDIA_H100_GPUS N/A PREEMPTIBLE_NVIDIA_H100_GPUS N/A
A100 40 GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS N/A PREEMPTIBLE_NVIDIA_A100_GPUS N/A
A100 80 GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS N/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/A
L4 NVIDIA_L4_GPUS COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS N/A PREEMPTIBLE_NVIDIA_V100_GPUS N/A
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS N/A PREEMPTIBLE_NVIDIA_K80_GPUS N/A

Cotas de alocação para recursos preemptivas

Para usar CPUs e GPUs preemptivas ou SSDs locais anexados a instâncias de VM preemptivas, é necessário ter cotas disponíveis no projeto para o respectivo recurso.

É possível solicitar cotas preemptíveis especiais para Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). No entanto, se o projeto não tiver uma cota preemptiva e você nunca tiver solicitado a cota preemptiva, será possível consumir a cota padrão para iniciar recursos preemptivos.

Assim que essa cota for concedida para uma região no Compute Engine, todas as instâncias preemptivas são deduzidas dessa cota automaticamente. À medida que essa cota esgotar, é necessário solicitar uma cota preemptiva para esses recursos.

Endereços IP externos

Cada VM que precisar ser acessada diretamente pela Internet pública precisará de endereços IP externos suficientes. A cota de IP regional é usada para atribuir endereços IPv4 a VMs na região. A cota de IP global é usada para atribuir endereços IPv4 a recursos de rede global, como balanceadores de carga. O Google Cloud oferece diferentes tipos de endereços IP, dependendo das suas necessidades. Para mais informações sobre os custos, acesse Preços do endereço IP externo. Consulte Cotas e limites para ver informações sobre esse assunto.

  • Endereços IP externos em uso. Inclui endereços IP estáticos e temporários que estão sendo usados por um recurso.

  • Endereços IP externos estáticos: são endereços IP externos reservados para os recursos que resistem a reinicializações da máquina. É possível registrar esses endereços com serviços de DNS e provedor de domínio para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.

  • Endereços IP internos estáticos: permitem reservar endereços IP internos do intervalo de IP interno configurado na sub-rede. É possível atribuir esses endereços internos reservados a recursos conforme necessário.

Lançamentos de cotas

Ocasionalmente, o Google Cloud altera a cota padrão de recursos e APIs. Essas mudanças ocorrem de forma gradual. Durante o lançamento de uma nova cota padrão, a cota máxima que aparece no console do Google Cloud pode não refletir a cota máxima real disponível.

Por exemplo, suponha que o Google Cloud altere a cota máxima padrão das regras de firewall de 200 para 300 e você use o console do Google Cloud para visualizar sua cota. Talvez você encontre a nova cota de 300, mesmo que sua cota real seja de 200 até a conclusão do lançamento.

Para mais informações sobre lançamentos de cotas em andamento, consulte problemas conhecidos. Se nenhum problema for descrito, não haverá lançamento de cota em andamento.

Se um lançamento de cota estiver em andamento e você quiser confirmar a cota máxima real disponível, use a Google Cloud CLI para verificar sua cota. Se você precisar de mais cota do que o acesso, envie uma solicitação de aumento de cota.

A seguir