Cotas e limites do Cloud Run

Veja nesta página as cotas e limites de uso que se aplicam ao Cloud Run.

O número de recursosdo Cloud Run é limitado. As cotas do Cloud Run incluem os limites de taxa da API, o que afeta o valor de chamada da API Cloud Run Admin.

Não há limite direto para:

  • o tamanho das imagens do contêiner que é possível implantar;
  • o número de solicitações simultâneas exibidas por um serviço do Cloud Run.

Limites de recursos para o Cloud Run

Recurso Descrição Limite Pode aumentar? Escopo
Serviço Número máximo de serviços 1.000 Não por projeto e região
Job Número máximo de jobs 1000 Não por projeto e região
Execução de serviço e job Número máximo de serviços e execuções de jobs 1000 Não por projeto e região
Revisão Número máximo de revisões por serviço. Quando o limite for atingido, as revisões não veiculadas serão excluídas automaticamente a partir das mais antigas 1.000 Não por serviço
Revisão e execução de jobs Número máximo de revisões que disponibilizam o tráfego e executam execuções de jobs 4000 Não por projeto e região
Tag de revisão Número máximo de tags de revisão 2000 Não por projeto e região
Execução do trabalho Limite de retenção para execuções de job concluídas. Quando o número de execuções completas de um job atinge esse limite, elas são excluídas automaticamente em ordem histórica. 1.000 Não por job
Tarefa de execução do job1 Número máximo de tarefas em execução em paralelo Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Sim por execução de job
Tarefa de execução do job Valor de tempo limite máximo de tarefas 24 horas Não por execução de job
Tarefa de execução do job Número máximo de tarefas em um único job 10.000 Não por execução de job
Tarefa de execução do job Número máximo de novas tentativas de tarefas em um job 10 Não por execução de job
Instância de contêiner1 Número máximo de instâncias de contêiner Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Yes por revisão
Instância de contêiner1 Número máximo de instâncias de contêiner de todas as execuções do job em execução Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. Sim por projeto e região
Instância de contêiner2 Número máximo de instâncias de contêiner que usam a saída de VPC direta 100 a 200, dependendo das configurações de região selecionadas. Sim por revisão e região
Instância de contêiner Tempo limite de inicialização, em minutos 4 Não por instância de contêiner
Memória Tamanho máximo da memória, em GiB 32 Não por instância de contêiner
CPU Número máximo de vCPU 8 Não por instância de contêiner
Disk Sistema de arquivos em memória gravável máximo, limitado pela memória da instância, em GiB 32 Não por instância de contêiner
Variável de ambiente Comprimento máximo da variável, em KB 32 Não por variável
Mapeamento de domínios Número máximo de certificados SSL 50 Não por domínio superior e por semana
Mapeamento de domínios Número máximo de certificados SSL duplicados 5 Não por domínio superior e por semana
Token de acesso Número máximo de tokens de acesso exclusivos gerados 50 Não por instância de contêiner/segundo
Token de identidade Número máximo de tokens de identidade exclusivos gerados 50 Não por instância de contêiner/segundo

1Essa cota regional é usada em alguns casos:

  1. Ela controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.

  2. Ele controla o paralelismo máximo de um job. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.

  3. Ele controla o total de instâncias de contêiner para executar execuções de job em uma região.

2Essa cota regional é usada em alguns casos:

  1. Ele controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão usando a saída de VPC direta. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.

  2. Ele controla o parallelism máximo de um job usando a saída de VPC direta. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.

Limites de rede para o Cloud Run

Limites de solicitação do Cloud Run

Descrição Limite Observações
Número máximo de solicitações simultâneas por instância 1000
Número máximo de streams simultâneos por conexão de cliente HTTP/2 100
Tempo máximo antes do tempo limite por solicitação 60 minutos
Tamanho máximo da solicitação HTTP/1 32 MiB se estiver usando o servidor HTTP/1. Sem limite se estiver usando o servidor HTTP/2.
Tamanho máximo da resposta HTTP/1 32 MiB se não estiver usando Transfer-Encoding: chunked ou mecanismos de streaming
Conexões de saída por segundo por instância 700
Solicitações de entrada por segundo para uma porta de contêiner HTTP/1 por instância 800 Não se aplica a portas de contêiner HTTP/2.

Limites de largura de banda para o Cloud Run

Os seguintes limites de largura de banda se aplicam a instâncias do Cloud Run:

Descrição Limite Observações
Máximo de bytes por instância 75 megabytes por segundo (MBps) Esse limite é baseado na soma dos bytes de entrada e de saída, excluindo a saída por saída VPC direta para destinos na rede VPC.
Taxa total máxima de pacotes por instância 64.000 pacotes por segundo Esse limite é baseado na soma dos pacotes de entrada e dos pacotes de saída, excluindo a saída por saída VPC direta para destinos na rede VPC.

Se um dos dois limites for atingido, a instância do Cloud Run terá largura de banda limitada.

Limitações de taxa da API Cloud Run Admin

As seguintes limitações de taxa se aplicam à API Cloud Run Admin. Eles não se aplicam às solicitações que chegam aos serviços implantados do Cloud Run.

Cota Descrição Limite Pode aumentar? Escopo
Solicitações de leitura da API Cloud Run Admin O número de leituras da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de leitura para os serviços do Cloud Run, o que não é limitado. 3.000 a cada 60 segundos Sim por projeto e região
Solicitações de gravação da API Cloud Run Admin O número de gravações da API por 60 segundos. Esse valor não representa o número de solicitações de gravação para os serviços do Cloud Run, o que não é limitado. 180 a cada 60 segundos Sim por projeto e região
Execução do job Número máximo de vezes que um job pode ser executado a cada 60 segundos por região. 180 a cada 60 segundos Sim por projeto e região

Como aumentar a cota

Para solicitar um valor de cota maior usando o console do Google Cloud:

  1. Acesse a página Cotas:

    Acessar "Cotas"

    As etapas restantes serão exibidas automaticamente no console do Google Cloud.

  2. Na página Cotas, encontre a cota que você quer aumentar na coluna Cota.

    Use a caixa de pesquisa Filtro para procurar sua cota.

  3. Marque a caixa de seleção à esquerda da cota.

  4. Clique em EDITAR COTAS . O formulário Alterações de cota é exibido.

  5. No formulário Mudanças de cota, digite a cota maior que você quer para o projeto no campo Novo limite.

  6. Preencha todos os campos do formulário e clique em CONCLUÍDO.

  7. Clique em ENVIAR SOLICITAÇÃO.

Embora o procedimento anterior se aplique à maioria das solicitações de aumento de cota, é possível encontrar uma das seguintes exceções:

  • Caso haja um limite de uso, é necessário remover esse limite para que a cota possa ser aumentada. Você receberá uma declaração e um contrato. A declaração diz que o limite de uso será excluído e o limite será atualizado para o limite padrão imediatamente. Seu pedido de aumento de cota será processado normalmente pelo Google Cloud normalmente.
  • Às vezes, o console do Google Cloud redireciona você para um formulário separado para solicitar um limite maior. Depois de enviar o formulário, o Google Cloud confirmará sua solicitação por e-mail.
  • Não é possível atualizar algumas cotas usando o Console do Google Cloud. Se você achar que não consegue alterar uma cota no console, solicite o aumento do Cloud Customer Care. A equipe de faturamento não lida com aumentos de limite de cota.

O Google recomenda que você crie uma solicitação de aumento de cota diferente para cada classe de recursos. Por exemplo, separe os aumentos de cota de rede por projeto dos aumentos de cota do Compute Engine sem rede. Se classes diferentes de solicitações forem combinadas, uma solicitação de aumento poderá atrasar o lote se a aprovação exigir mais tempo de avaliação.

Caso sua solicitação de aumento de cota exija aprovação, você receberá um e-mail de confirmação do Google Cloud. Se precisar de mais ajuda, responda a esse e-mail. O Cloud Customer Care normalmente processa sua solicitação em dois a três dias úteis. O Cloud Customer Care envia um segundo e-mail notificando se o aumento da cota foi aprovado ou negado. O e-mail informa a data efetiva do aumento, se aplicável.

Para saber mais sobre como o processo de aumento de cota funciona, consulte Sobre solicitações de aumento de cota.