Cotas de recursos

O Compute Engine impõe cotas sobre o uso de recursos para impedir abuso e uso acidental, além de proteger usuários de efeitos indesejáveis de outras contas. Por exemplo, as cotas protegem a comunidade de usuários do Google Cloud ao impedir picos de uso inesperados. O Google Cloud também oferece cotas de avaliação gratuita que proporcionam acesso limitado a projetos para ajudar você a explorar o Google Cloud gratuitamente.

Caso espere um aumento de uso significativo, solicite o ajuste das cotas na página Cotas no Console do Cloud.

Como verificar cotas

A cota de cada projeto é diferente. Para verificar a cota disponível para um projeto, acesse a página Cotas no Console do Google Cloud.

Na ferramenta de linha de comando gcloud, execute o comando a seguir para verificar as cotas de todo o projeto. Substitua myproject pelo ID do projeto:

gcloud compute project-info describe --project myproject

Observe que os resultados não listam cotas por região. Para listar cotas em uma região, execute este comando, onde [REGION] é a região em que você quer listar as informações de cota:

gcloud compute regions describe [REGION]

Como solicitar um aumento de cota

Para solicitar alterações na cota, acesse a página Cotas no Console do Cloud. Não há custo algum para solicitar um aumento de cota. Seus custos aumentam apenas se você usar mais recursos.

Permissão para editar cotas

Para alterar suas cotas, você precisa ter a permissão serviceusage.quotas.update. Por padrão, ela está incluída nos seguintes papéis predefinidos: proprietário, editor e administrador de cotas.

Solicite uma alteração da cota

  1. Acesse a página Cotas.

    Acessar a página "Cotas"

  2. Na página Cotas, selecione as que você quer alterar.
  3. Clique no botão Editar cotas na parte superior da página.
  4. Marque a caixa do serviço que você quer editar.
  5. Preencha seu nome, e-mail e número de telefone, e clique em Próxima.
  6. Insira a solicitação para aumentar a cota e clique em Próxima.
  7. Envie a solicitação.
  8. Solicitações para redução de cota serão recusadas por padrão. Caso seja preciso reduzir sua cota, responda ao e-mail de suporte com uma explicação dos seus requisitos. Um representante de suporte da equipe do Compute Engine responderá sua solicitação no prazo de 24 a 48 horas.

Planeje e solicite recursos adicionais com pelo menos alguns dias de antecedência para garantir que haja tempo suficiente para atender seu pedido.

Cotas e disponibilidade de recursos

As cotas de recursos são o número máximo de recursos de um tipo específico que você criará, se eles estiverem disponíveis. Elas não garantem que os recursos estarão sempre disponíveis. Se um recurso não estiver disponível ou se a região que você escolher estiver sem recursos, não será possível criar novos recursos desse tipo, mesmo que ainda haja cota restante na região ou no projeto. Por exemplo, você ainda pode ter uma cota para criar endereços IP externos em us-central1, mas talvez não haja endereços IP disponíveis nesta região.

Da mesma forma, mesmo que você tenha uma cota regional, é possível que um recurso não esteja disponível em uma zona específica. Por exemplo, você tem uma cota na região us-central1 para criar instâncias de VM, mas talvez não consiga criá-las na zona us-central1-a se ela estiver esgotada. Nesse caso, tente criar o mesmo recurso em outra zona, como us-central1-f. Para saber mais sobre suas opções, se os recursos zonais estiverem esgotados, consulte Solução de problemas geral.

Como entender as cotas

Ao planejar a instância da máquina virtual (VM), considere as cotas que afetam as ocorrências de VM que você pode criar.

Cotas regionais e globais

As cotas de VM são gerenciadas no nível regional. As cotas da instância de VM, grupo de instâncias, CPU e de disco podem ser consumidas por qualquer VM na região, independentemente da zona. Por exemplo, a cota da CPU é regional. Sendo assim, o limite e a contagem de uso são diferentes para cada região. Para iniciar uma instância de n1-standard-16 em qualquer zona na região us-central1, você precisa de cota suficiente para pelo menos 16 CPUs em us-central1.

São necessárias cotas de rede e balanceamento de carga para a criação de firewalls, balanceadores de carga, redes e VPNs. Essas cotas são globais e não dependem de região. Qualquer região pode usar uma cota global. Por exemplo, os endereços IP externos em uso e estáticos atribuídos a balanceadores de carga e proxies HTTP(S) consomem cotas globais.

CPUs

A cota de CPU é o número total de CPUs virtuais em todas as suas instâncias de VM em uma região. As cotas de CPU se aplicam a instâncias em execução e reservas de instâncias. As instâncias preemptivas e normais consomem essa cota.

Para proteger os usuários e sistemas do Compute Engine, novas contas e projetos têm, também, uma cota CPUs (All Regions) global que se aplicará a todas as regiões e é medida como a soma de todas as vCPUs em todas as regiões.

Por exemplo, se você tiver 48 vCPUs restantes em uma única região como us-central1, mas apenas 32 vCPUs restantes para a cota de CPUs (All Regions), só é possível iniciar 32 vCPUs na região us-central1, mesmo que haja uma cota maior nessa região. Isso ocorre porque você alcançará a cota de CPU (All Regions) e terá que excluir as instâncias atuais antes de poder iniciar novas instâncias.

GPUs

Assim como acontece com a cota de CPU virtual, a cota de GPU refere-se ao número total de GPUs virtuais em todas as instâncias de VM em uma região. Verifique a página de cotas para garantir que você tenha GPUs disponíveis suficientes no seu projeto e para solicitar um aumento de cota. Além disso, novos projetos e contas têm uma cota global de GPU que se aplica a todas as regiões.

Quando você solicita uma cota de GPU, é necessário pedir uma cota para os modelos de GPU que você quer criar em cada região e outra cota global para o número total de GPUs de todos os tipos em todas as zonas.

Instâncias de VM

A cota de instâncias de VM é regional e limita o número de instâncias de VM que podem existir em uma determinada região, esteja a VM em execução ou não. Essa cota não é visível no Console do Google Cloud, mas é definida automaticamente pelo Compute Engine para ser 10 vezes sua cota de CPU normal. Não é necessário solicitar essa cota. Caso você precise de cota para mais instâncias de VM, solicite mais CPUs, porque elas aumentarão sua cota. Ela se aplica a VMs em execução ou não e a instâncias normais e preemptivas.

Cotas para recursos preemptivos

Para usar CPUs e GPUs preemptivas ou SSDs locais anexados a instâncias de VM preemptivas, é necessário ter disponível no projeto as cotas para o respectivo recurso.

Você pode solicitar cotas preemptíveis especiais para: Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). No entanto, se o projeto não tiver uma cota preemptiva, será preciso usar a cota normal para iniciar recursos preemptivos.

Assim que essa cota for concedida para uma região no Compute Engine, todas as instâncias preemptivas são deduzidas dessa cota automaticamente.

Cotas de disco

As cotas de disco permanente e SSD local a seguir aplicam-se por região:

  • Local SSD (GB) é o tamanho total combinado das partições de disco SSD local que podem ser anexadas às VMs em uma região. O SSD local é um disco temporário rápido que pode ser usado como disco de trabalho e para cache local ou processamento de jobs com alta tolerância a falhas. O disco não tem resistência a reinicializações de instâncias de VM. As partições de SSD local são vendidas em incrementos de 375 GB. É possível anexar até oito partições de SSD local a uma única VM. Na ferramenta gcloud e na API, isso é chamado de LOCAL_SSD_TOTAL_GB.

  • Persistent disk standard (GB) é o tamanho total dos discos permanentes padrão que podem ser criados em uma região. Conforme descrito em Como otimizar o desempenho de discos permanentes e SSDs locais, os discos permanentes padrão oferecem menor IOPS e capacidade do que os discos permanentes SSD ou SSDs locais. São econômicos quando usados como grandes discos duráveis para armazenamento, como discos de inicialização, e para processos de gravação em série, como registros. Os discos permanentes padrão são duráveis e estão disponíveis indefinidamente para serem anexados a uma VM na mesma zona. Na ferramenta gcloud e na API, isso é chamado de DISKS_TOTAL_GB. Essa cota também se aplica aos discos permanentes padrão regionais. No entanto, discos regionais consomem o dobro da cota por GB, devido à replicação em duas zonas de uma região.

  • Persistent disk SSD (GB) é o tamanho total combinado das partições de discos permanentes SSD que podem ser criadas em uma região. Os discos permanentes SSD têm várias réplicas. Conforme descrito em Como otimizar o desempenho de discos permanentes e SSDs locais, eles oferecem maior IOPS e capacidade do que os discos permanentes padrão. Os discos SSD permanentes são econômicos para armazenamento durável com requisitos de E/S elevados. Eles estão disponíveis indefinidamente para serem anexados a uma VM na mesma zona. Na ferramenta gcloud e na API, isso é chamado de SSD_TOTAL_GB. Esta cota é separada do SSD local. Essa cota também se aplica aos discos permanentes SSD regionais. No entanto, discos regionais consomem o dobro da cota por GB, devido à replicação em duas zonas de uma região.

Endereços IP

Cada VM que tenha que ser acessada pela Internet pública precisa de endereços IP suficientes. A cota de IP regional é usada para atribuir endereços IPv4 a VMs nessa região. A cota de IP global é usada para atribuir endereços IPv4 a recursos de rede global como proxies HTTP e balanceadores de carga. O Google Cloud oferece diferentes tipos de endereços IP, dependendo das suas necessidades. Para mais informações sobre os custos, acesse Preços do endereço IP externo.

  • Endereço IP em uso. Inclui endereços IP estáticos e temporários que estão sendo usados no momento por um recurso.
  • Endereços IP externos estáticos: são endereços IP externos reservados para os recursos que resistem a reinicializações da máquina. É possível registrar esses endereços com serviços de DNS e provedor de domínio para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.
  • Endereços IP internos estáticos: são endereços IP internos que oferecem a possibilidade de reservar o endereço IP interno do intervalo configurado na sub-rede. É possível atribuir esses endereços internos reservados a recursos conforme necessário.

Grupos de instâncias

Para usar grupos de instâncias, é necessário ter cota disponível para todos os recursos que o grupo usará (por exemplo, cota de CPU), além de cota disponível para o próprio recurso do grupo. Dependendo do tipo de grupo criado, aplicam-se as cotas de recurso de grupo a seguir:

Tipo de serviço Cota de serviço
Grupo regional de instâncias gerenciadas (várias zonas) Regional instance group managers
Grupo por zona de instâncias gerenciadas (única zona) Ambos:
  • Instance group managers
  • Instance groups
Grupo de instâncias não gerenciadas (única zona) Instance groups
Escalonador automático regional (várias zonas) Regional autoscalers
Escalonador automático de zona (única zona) Autoscalers