Cotas e limites do Cloud Run

Veja nesta página as cotas e limites de uso que se aplicam ao Cloud Run.

O número de recursosdo Cloud Run é limitado. As cotas do Cloud Run incluem os limites de taxa da API, o que afeta o valor de chamada da API Cloud Run Admin.

Não há limite direto para:

  • o tamanho das imagens do contêiner que é possível implantar;
  • o número de solicitações simultâneas exibidas por um serviço do Cloud Run.

Limites de recursos para o Cloud Run

Recurso Descrição Limite Pode aumentar? Escopo
Serviço Número máximo de serviços 1.000 Não por projeto e região
Job Número máximo de jobs 1000 Não por projeto e região
Revisão Número máximo de revisões por serviço. Quando o limite for atingido, as revisões não veiculadas serão excluídas automaticamente a partir das mais antigas 1.000 Não por serviço
Revisão Número máximo de revisões que exibem o tráfego 4000 Não por projeto e região
Tag de revisão Número máximo de tags de revisão 2000 Não por projeto e região
Execução do trabalho Limite de retenção para execuções de job concluídas. Quando o número de execuções completas de um job atinge esse limite, elas são excluídas automaticamente em ordem histórica. 1.000 Não por job
Tarefa de execução do job1 Número máximo de tarefas em execução em paralelo 200 ao usar 1 CPU e 2 GiB de memória, dependendo das configurações de CPU e memória. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Sim por execução de job
Tarefa de execução do job Valor de tempo limite máximo de tarefas 1 hora Não por execução de job
Tarefa de execução do job Número máximo de tarefas em um único job 10.000 Não por execução de job
Tarefa de execução do job Número máximo de novas tentativas de tarefas em um job 10 Não por execução de job
Instância de contêiner1 Número máximo de instâncias de contêiner Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Yes por revisão
Instância de contêiner1 Número máximo de instâncias de contêiner de todas as execuções do job em execução 200 ao usar 1 CPU e 2 GiB de memória, dependendo das configurações de CPU e memória. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Sim por projeto e região
Instância de contêiner Tempo limite de inicialização, em minutos 4 Não por instância de contêiner
Instância de contêiner Conexões de saída por segundo 700 Não por instância de contêiner
Instância de contêiner Solicitações de entrada por segundo para uma porta de contêiner HTTP/1 (não se aplica a portas de contêiner HTTP/2) 800 Não por instância de contêiner
Memória Tamanho máximo da memória, em GiB 32 Não por instância de contêiner
CPU Número máximo de vCPU 8 Não por instância de contêiner
Disk Sistema de arquivos em memória gravável máximo, limitado pela memória da instância, em GiB 32 Não por instância de contêiner
Variável de ambiente Comprimento máximo da variável, em KB 32 Não por variável
Solicitação Número máximo de solicitações simultâneas 1000 Não por instância de contêiner
Solicitação Número máximo de streams simultâneas 100 Não por conexão de clientes HTTP/2
Solicitação Tempo máximo antes do tempo limite, em minutos 60 Não por solicitação
Solicitação Tamanho máximo da solicitação HTTP/1 em MiB 32 se estiver usando o servidor HTTP/1. Sem limite se estiver usando o servidor HTTP/2. Não por solicitação
Resposta Tamanho máximo da resposta HTTP/1 em MiB 32 se não estiver usando Transfer-Encoding: chunked ou mecanismos de streaming Não por resposta
Mapeamento de domínios Número máximo de certificados SSL 50 Não por domínio superior e por semana
Mapeamento de domínios Número máximo de certificados SSL duplicados 5 Não por domínio superior e por semana
Token de acesso Número máximo de tokens de acesso exclusivos gerados 50 Não por instância de contêiner/segundo
Token de identidade Número máximo de tokens de identidade exclusivos gerados 50 Não por instância de contêiner/segundo

1Essa cota regional é usada em alguns casos:

  1. Ela controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.

  2. Ele controla o paralelismo máximo de um job. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.

  3. Ele controla o total de instâncias de contêiner para executar execuções de job em uma região.

OBSERVAÇÃO: quando essa cota é usada para jobs, ela é dividida por cinco.

Limitações de taxa da API Cloud Run Admin

As seguintes limitações de taxa se aplicam à API Cloud Run Admin. Eles não se aplicam às solicitações que chegam aos serviços implantados do Cloud Run.

Cota Descrição Limite Pode aumentar? Escopo
Solicitações de leitura da API Cloud Run Admin O número de leituras da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de leitura para os serviços do Cloud Run, o que não é limitado. 1.200 por 60 segundos Sim Regional
Solicitações de gravação da API Cloud Run Admin O número de gravações da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de gravação para os serviços do Cloud Run, o que não é limitado. 60 por 60 segundos Sim Regional
Execução do job Número máximo de vezes que um job pode ser executado por minuto e por região 10 Yes por projeto e região

Como aumentar a cota

Para aumentar as cotas acima dos padrões listados nesta página, siga estas etapas:

  1. Acesse a página de cotas do Cloud Run.

  2. Selecione as cotas que você quer modificar para as regiões aplicáveis e clique em EDITAR COTAS.

  3. Se solicitado, forneça as informações do usuário e insira o novo limite de cada cota selecionada.

A solicitação será encaminhada à equipe de suporte para garantir que o Cloud Run possa processar seu caso de uso na região selecionada. Talvez você precise fornecer detalhes sobre sua configuração e os padrões de tráfego esperados antes que a solicitação seja concedida. O processamento de solicitações de aumento grandes pode levar algum tempo.