Esta página foi traduzida pela API Cloud Translation.

Cotas e limites do Cloud Run

Veja nesta página as cotas e limites de uso que se aplicam ao Cloud Run.

O número de recursosdo Cloud Run é limitado. As cotas do Cloud Run incluem os limites de taxa da API, o que afeta o valor de chamada da API Cloud Run Admin.

Não há limite direto para:

o tamanho das imagens do contêiner que é possível implantar;
o número de solicitações simultâneas exibidas por um serviço do Cloud Run.

Limites de recursos para o Cloud Run

Para ultrapassar os limites que podem ser aumentados, solicite um aumento de cota. Para ultrapassar os limites por projeto que não podem ser aumentados, crie novos recursos em um projeto ou região diferente do Google Cloud .

Recurso	Escopo	Descrição	Limite	Pode aumentar?
Serviço	por projeto e região	Número máximo de serviços	1.000	Não
Job	por projeto e região	Número máximo de jobs	1000	Não
Execução do trabalho	por projeto e região	Número máximo de jobs em execução	1.000	Não
Revisão	por serviço	Número máximo de revisões por serviço. Quando o limite for atingido, as revisões não veiculadas serão excluídas automaticamente a partir das mais antigas	1.000	Não
Revisão	por projeto e região	Número máximo de revisões que exibem o tráfego	4.000	Não
Tag de revisão	por projeto e região	Número máximo de tags de revisão. Quando o limite de tags de revisão é excedido, o Cloud Run executa a limpeza de tags no serviço. No caso do serviço em que uma nova tag está sendo criada, as tags que não têm uma porcentagem de tráfego especificada são excluídas automaticamente na ordem histórica.	2.000	Não
Execução do trabalho	por job	Limite de retenção para execuções de job concluídas. Quando o número de execuções completas de um job atinge esse limite, elas são excluídas automaticamente em ordem histórica.	1.000	Não
Tarefa de execução do job¹	por execução de job	Número máximo de tarefas em execução em paralelo	Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. É possível conferir sua cota na página do console Cotas e limites do sistema.	Sim
Tarefa de execução do job	por execução de job	Valor de tempo limite máximo de tarefas	168 horas (7 dias)²	Não
Tarefa de execução do job	por execução de job	Número máximo de tarefas em um único job	10.000	Não
Tarefa de execução do job	por execução de job	Número máximo de novas tentativas de tarefas em um job	10	Não
Variáveis de ambiente	por job ou por serviço	Número máximo de variáveis de ambiente para cada contêiner	1.000	Não
Argumentos do comando	por job ou por serviço	Número máximo de argumentos de comando para cada contêiner	1.000	Não
Instância de contêiner³	por revisão e região	Número máximo de instâncias de contêiner que usam a saída de VPC direta	100 a 200, dependendo das configurações de região selecionadas.	Sim
Instância de contêiner	por instância de contêiner	Tempo limite de inicialização, em minutos	4	Não
Memória	por instância de contêiner	Tamanho máximo da memória, em GiB	32	Não
CPU	por instância de contêiner	Número máximo de vCPU	8	Não
CPU¹	por projeto e região	Total máximo de CPU, em mili vCPU, alocado em todas as instâncias em um período de 1 minuto.	Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente.	Sim
Memória¹	por projeto e região	Memória total máxima, em bytes, alocada em todas as instâncias em um período de 1 minuto.	Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. É possível conferir sua cota na página do console Cotas e limites do sistema.	Sim
Instância de GPU sem garantia de redundância zonal¹, ⁴	por projeto e por região	Número máximo de instâncias de contêiner com GPU	0⁴	Sim
Instância de GPU com garantia de redundância zonal¹, ⁴	por projeto e por região	Número máximo de instâncias de contêiner com GPU	0⁴	Sim
Disco	por instância de contêiner	Sistema de arquivos em memória gravável máximo, limitado pela memória da instância, em GiB	32	Não
Variável de ambiente	por variável	Comprimento máximo da variável, em KB	32	Não
Mapeamento de domínios	por domínio superior e por semana	Número máximo de certificados SSL	50	Não
Mapeamento de domínios	por domínio superior e por semana	Número máximo de certificados SSL duplicados	5	Não
Token de acesso	por instância de contêiner/segundo	Número máximo de tokens de acesso exclusivos gerados	50	Não
Token de identidade	por instância de contêiner/segundo	Número máximo de tokens de identidade exclusivos gerados	50	Não
Arquivos abertos	por instância de contêiner	Número máximo de arquivos que podem ser abertos ao mesmo tempo. Corresponde a `/proc/sys/fs/file-max`.	25.000	Não

¹Essas cotas regionais são usadas em alguns casos em que cada uma controla:

O valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.

O paralelismo máximo de um job. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.

O total de instâncias de contêiner para executar execuções de job em uma região.

²O suporte para tempos limite maiores que 24 horas está disponível na Prévia.

³Essa cota regional é usada em alguns casos:

Ele controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão usando a saída de VPC direta. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.

Ele controla o paralelismo máximo de um job usando a saída de VPC direta. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.

⁴ Os novos projetos que criarem um serviço com GPUs L4 vão receber automaticamente três NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Você também pode solicitar cota de NvidiaL4GpuAllocPerProjectRegion ou NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Se o uso máximo da GPU não estiver próximo da sua cota, o Google poderá diminuir a cota.

Limites de rede para o Cloud Run

Limites de solicitação do Cloud Run

Descrição	Limite	Observações
Número máximo de solicitações simultâneas por instância	1000
Número máximo de streams simultâneos por conexão de cliente HTTP/2	100
Tempo máximo antes do tempo limite por solicitação	60 minutos
Tamanho máximo da solicitação HTTP/1	32 MiB se estiver usando o servidor HTTP/1. Sem limite se estiver usando o servidor HTTP/2.
Tamanho máximo da resposta HTTP/1	32 MiB se não estiver usando `Transfer-Encoding: chunked` ou mecanismos de streaming
Número máximo de conexões abertas por instância e por tipo de saída (Internet ou VPC)	50000	Não se aplica ao tráfego de saída direta da VPC.
Conexões de saída por segundo por instância	700	Não se aplica ao tráfego de saída direta da VPC enviado à rede VPC, que não é limitado.
Resoluções de DNS de saída por segundo por instância	1.000
Solicitações de entrada por segundo para uma porta de contêiner HTTP/1 por instância	800	Não se aplica a portas de contêiner HTTP/2.

Limites de largura de banda para o Cloud Run

Os seguintes limites de largura de banda se aplicam a instâncias do Cloud Run:

Descrição	Limite	Observações
Máximo de bits por instância para saída por VPC direta	1 Gbps	Saída pela saída VPC direta para destinos na rede VPC.
Máximo de bits por instância, exceto a saída por VPC direta	600 Mbps	Com base na soma dos bits de entrada e de saída, excluindo a saída por saída VPC direta para destinos na rede VPC.
Taxa total máxima de pacotes por instância, excluindo a saída por VPC direta	64.000 pacotes por segundo	Com base na soma dos pacotes de entrada e de saída, excluindo a saída por saída VPC direta para destinos na rede VPC.

Se um dos dois limites for atingido, a instância do Cloud Run terá largura de banda limitada.

Limitações de taxa da API Cloud Run Admin

As seguintes limitações de taxa se aplicam à API Cloud Run Admin. Eles não se aplicam às solicitações que chegam aos serviços implantados do Cloud Run.

Cota	Descrição	Limite	Pode aumentar?	Escopo
Solicitações de leitura da API Cloud Run Admin	O número de leituras da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de leitura para os serviços do Cloud Run, o que não é limitado.	3.000 a cada 60 segundos	Sim	por projeto e região
Solicitações de gravação da API Cloud Run Admin	O número de gravações da API por 60 segundos. Esse valor não representa o número de solicitações de gravação para os serviços do Cloud Run, o que não é limitado.	180 a cada 60 segundos	Sim	por projeto e região
Execução do job	Número máximo de vezes que um job pode ser executado a cada 60 segundos por região.	180 a cada 60 segundos	Sim	por projeto e região

Como aumentar a cota

As solicitações de ajuste de cotas do Cloud estão sujeitas a revisão. Se o pedido de ajuste de cota exigir análise, você vai receber um e-mail confirmando o recebimento da solicitação. Se precisar de mais ajuda, responda ao e-mail. Depois de analisar sua solicitação, você vai receber uma notificação por e-mail indicando se ela foi aprovada.

Console

Para ajustar um valor de cota, siga estas etapas:

No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Acesse "Cotas e limites do sistema
Encontre o valor da cota que você quer atualizar na coluna Cota e marque a caixa de seleção ao lado da cota que você quer atualizar.

Se necessário, use a caixa de pesquisa Filtro para buscar sua cota.
Clique em Editar e a caixa de diálogo Mudanças de cota vai aparecer.
Insira o valor da cota que você quer no campo Novo valor. Alguns valores de cota têm uma unidade de medida. Se for o caso, selecione a unidade desejada na lista adjacente. Clique em Concluído.

Opcional: se você encontrar uma caixa de seleção com o texto I understand that this request will remove any overrides, isso significa que ajustar o valor da cota para um número igual ou maior que o padrão vai remover a substituição de cota anterior. Se for esse o caso, selecione a caixa de seleção e prossiga.
Para aumentar o valor da cota além do número indicado na caixa de diálogo, selecione Inscrever-se para uma cota maior.
1. No formulário Mudanças de cota, insira o valor de cota atualizado que você quer no campo Novo valor. Se um campo Descrição da solicitação aparecer, insira uma descrição. Clique em Concluído.
2. Se um botão Avançar aparecer, clique nele e preencha as informações de contato na tela seguinte.
Clique em Enviar solicitação.

Se você não conseguir solicitar um ajuste no console, peça o aumento ao Cloud Customer Care.

Para saber mais sobre como o processo de aumento de cota funciona, consulte Sobre ajustes de cota.

Solicitações em lote para valores de cota mais altos

É possível agrupar solicitações para uma cota maior selecionando a caixa de seleção ao lado de cada cota que você quer incluir. No entanto, as solicitações em lote podem aumentar o tempo que o Google Cloud leva para analisar seu pedido.

Para reduzir o tempo de análise, agrupe as solicitações de ajuste de cota por produto e área. Por exemplo, se você quiser solicitar ajustes nas cotas de rede e de VM do Compute Engine, crie uma solicitação para as cotas de rede e outra para as cotas de VM do Compute Engine.

Cotas e limites do Cloud Run Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.