Quotas e limites


Este documento indica as quotas e os limites do sistema que se aplicam ao Google Kubernetes Engine.

  • As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema de quotas da nuvem faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Para mais informações, consulte a vista geral das quotas da nuvem.

Para ajustar a maioria das quotas, use a Google Cloud consola. Para mais informações, consulte o artigo Peça um ajuste da quota.

Também existem limites do sistema nos recursos do GKE. Não é possível alterar os limites do sistema.

Quotas por projeto

O GKE tem as seguintes quotas:

Nota: os clusters criados no modo Autopilot são pré-configurados como clusters regionais.

Verifique a sua quota

Pode ver as quotas na Google Cloud consola. Aceda à página Quotas.

Aceder a Quotas

Para gerir e pedir quotas adicionais, consulte o artigo Veja e faça a gestão das quotas

Limites por cluster

As tabelas seguintes descrevem os limites por cluster do GKE.

Todas as versões do GKE especificadas na tabela seguinte aplicam-se aos nós do cluster e ao plano de controlo.

Limites Cluster padrão do GKE Cluster do GKE Autopilot
Nós por cluster 65 000 nós

Se planeia usar este limite, considere as seguintes recomendações ao criar a sua arquitetura do GKE:

5000 nós

Se planeia usar este limite, considere as seguintes recomendações ao criar a sua arquitetura do GKE:

  • Se planeia executar mais de 1000 nós, use a versão 1.23 ou mais recente do GKE Autopilot.
  • A execução de mais de 400 nós pode exigir a anulação de uma quota de tamanho do cluster para clusters criados em versões anteriores. Contacte o apoio técnico para receber assistência.
Nós por node pool 1000 nós por zona

2000 nós da TPU por zona: requer as seguintes versões ou versões mais recentes: 1.28.5-gke.135500, 1.29.1-gke.1206000, 1.30
Não aplicável
Nós numa zona
  • Sem limitações de nós para o balanceamento de carga nativo do contentor com entrada baseada em NEG, que é recomendado sempre que possível. Nas versões 1.17 e posteriores do GKE, o Ingress baseado em NEG é o modo predefinido.
  • 1000 nós se estiver a usar o Ingress baseado em grupos de instâncias.
Não aplicável
Pods por nó1 256 Pods

Nota: para versões do GKE anteriores à 1.23.5-gke.1300, o limite é de 110 pods.

Definido dinamicamente para qualquer valor entre 8 e 256. O GKE considera o tamanho do cluster e o número de cargas de trabalho para aprovisionar o número máximo de pods por nó.

  • Para versões do GKE anteriores à 1.28, o limite é de 32 pods.
  • Para agrupamentos da classe Accelerator e agrupamentos da classe Performance, o limite é de um agrupamento por nó.
Pods por cluster2 200 000 pods1 200 000 pods
Contentores por cluster 400 000 contentores 400 000 contentores
Tamanho da base de dados etcd 6 GB 6 GB

Como administrador da plataforma, recomendamos que se familiarize com a forma como as quotas afetam as cargas de trabalho grandes executadas no GKE. Para ver recomendações, práticas recomendadas, limites e quotas adicionais para cargas de trabalho grandes, consulte as diretrizes para criar clusters escaláveis.

Quotas de recursos

Para clusters com menos de 100 nós, o GKE aplica a quota de recursos do Kubernetes a todos os espaços de nomes. Estas quotas protegem o plano de controlo do cluster contra a instabilidade causada por potenciais erros nas aplicações implementadas no cluster. Não pode remover estas quotas porque são aplicadas pelo GKE.

O GKE atualiza automaticamente os valores da quota de recursos proporcionalmente ao número de nós. Para clusters com mais de 100 nós, o GKE remove a quota de recursos.

Para examinar as quotas de recursos, use o seguinte comando:

kubectl get resourcequota gke-resource-quotas -o yaml

Para ver os valores de um determinado espaço de nomes, especifique o espaço de nomes adicionando a opção --namespace.

Notas

  1. O número máximo de pods por cluster padrão do GKE inclui pods do sistema. O número de pods do sistema varia consoante a configuração do cluster e as funcionalidades ativadas.

  2. O número máximo de pods que podem caber num nó depende do tamanho dos pedidos de recursos de pods e da capacidade do nó. Pode não atingir todos os limites ao mesmo tempo. Como prática recomendada, sugerimos que teste o carregamento de implementações grandes.