Veja nesta página as cotas e limites de uso que se aplicam ao Cloud Run.
O número de recursosdo Cloud Run é limitado. As cotas do Cloud Run incluem os limites de taxa da API, o que afeta o valor de chamada da API Cloud Run Admin.
Não há limite direto para:
- o tamanho das imagens do contêiner que é possível implantar;
- o número de solicitações simultâneas exibidas por um serviço do Cloud Run.
Limites de recursos para o Cloud Run
Recurso | Descrição | Limite | Pode aumentar? | Escopo |
---|---|---|---|---|
Serviço | Número máximo de serviços | 1.000 | Não | por projeto e região |
Job | Número máximo de jobs | 1000 | Não | por projeto e região |
Execução de serviço e job | Número máximo de serviços e execuções em execução | 1000 | Não | por projeto e região |
Revisão | Número máximo de revisões por serviço. Quando o limite for atingido, as revisões não veiculadas serão excluídas automaticamente a partir das mais antigas | 1.000 | Não | por serviço |
Revisão e execução de jobs | Número máximo de revisões que disponibilizam o tráfego e executam execuções de jobs | 4000 | Não | por projeto e região |
Tag de revisão | Número máximo de tags de revisão | 2000 | Não | por projeto e região |
Execução do trabalho | Limite de retenção para execuções de job concluídas. Quando o número de execuções completas de um job atinge esse limite, elas são excluídas automaticamente em ordem histórica. | 1.000 | Não | por job |
Tarefa de execução do job1 | Número máximo de tarefas em execução em paralelo | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim | por execução de job |
Tarefa de execução do job | Valor de tempo limite máximo de tarefas | 24 horas | Não | por execução de job |
Tarefa de execução do job | Número máximo de tarefas em um único job | 10.000 | Não | por execução de job |
Tarefa de execução do job | Número máximo de novas tentativas de tarefas em um job | 10 | Não | por execução de job |
Instância de contêiner1 | Número máximo de instâncias de contêiner | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Yes | por revisão |
Instância de contêiner1 | Número máximo de instâncias de contêiner de todas as execuções do job em execução | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim | por projeto e região |
Instância de contêiner | Tempo limite de inicialização, em minutos | 4 | Não | por instância de contêiner |
Instância de contêiner | Conexões de saída por segundo | 700 | Não | por instância de contêiner |
Instância de contêiner | Solicitações de entrada por segundo para uma porta de contêiner HTTP/1 (não se aplica a portas de contêiner HTTP/2) | 800 | Não | por instância de contêiner |
Memória | Tamanho máximo da memória, em GiB | 32 | Não | por instância de contêiner |
CPU | Número máximo de vCPU | 8 | Não | por instância de contêiner |
Disk | Sistema de arquivos em memória gravável máximo, limitado pela memória da instância, em GiB | 32 | Não | por instância de contêiner |
Variável de ambiente | Comprimento máximo da variável, em KB | 32 | Não | por variável |
Solicitação | Número máximo de solicitações simultâneas | 1000 | Não | por instância de contêiner |
Solicitação | Número máximo de streams simultâneas | 100 | Não | por conexão de clientes HTTP/2 |
Solicitação | Tempo máximo antes do tempo limite, em minutos | 60 | Não | por solicitação |
Solicitação | Tamanho máximo da solicitação HTTP/1 em MiB | 32 se estiver usando o servidor HTTP/1. Sem limite se estiver usando o servidor HTTP/2. | Não | por solicitação |
Resposta | Tamanho máximo da resposta HTTP/1 em MiB | 32 se não estiver usando Transfer-Encoding: chunked ou mecanismos de streaming |
Não | por resposta |
Mapeamento de domínios | Número máximo de certificados SSL | 50 | Não | por domínio superior e por semana |
Mapeamento de domínios | Número máximo de certificados SSL duplicados | 5 | Não | por domínio superior e por semana |
Token de acesso | Número máximo de tokens de acesso exclusivos gerados | 50 | Não | por instância de contêiner/segundo |
Token de identidade | Número máximo de tokens de identidade exclusivos gerados | 50 | Não | por instância de contêiner/segundo |
1Essa cota regional é usada em alguns casos:
Ela controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.
Ele controla o paralelismo máximo de um job. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.
Ele controla o total de instâncias de contêiner para executar execuções de job em uma região.
Limites de largura de banda para o Cloud Run
Os seguintes limites de largura de banda se aplicam a instâncias do Cloud Run:
Descrição | Limite | Observações |
---|---|---|
Máximo de bytes por instância | 75 megabytes por segundo (MBps) | Esse limite é baseado na soma dos bytes de entrada e saída |
Taxa total máxima de pacotes por instância | 64.000 pacotes por segundo | Esse limite é baseado na soma dos pacotes de entrada e saída |
Se um dos dois limites for atingido, a instância do Cloud Run terá largura de banda limitada.
Limitações de taxa da API Cloud Run Admin
As seguintes limitações de taxa se aplicam à API Cloud Run Admin. Eles não se aplicam às solicitações que chegam aos serviços implantados do Cloud Run.
Cota | Descrição | Limite | Pode aumentar? | Escopo |
---|---|---|---|---|
Solicitações de leitura da API Cloud Run Admin | O número de leituras da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de leitura para os serviços do Cloud Run, o que não é limitado. | 1.200 por 60 segundos | Sim | Regional |
Solicitações de gravação da API Cloud Run Admin | O número de gravações da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de gravação para os serviços do Cloud Run, o que não é limitado. | 60 por 60 segundos | Sim | Regional |
Execução do job | Número máximo de vezes que um job pode ser executado por minuto e por região | 10 | Yes | por projeto e região |
Como aumentar a cota
Para aumentar as cotas acima dos padrões listados nesta página, siga estas etapas:
Acesse a página de cotas do Cloud Run.
Selecione as cotas que você quer modificar para as regiões aplicáveis e clique em EDITAR COTAS.
Se solicitado, forneça as informações do usuário e insira o novo limite de cada cota selecionada.
A solicitação será encaminhada à equipe de suporte para garantir que o Cloud Run possa processar seu caso de uso na região selecionada. Talvez você precise fornecer detalhes sobre sua configuração e os padrões de tráfego esperados antes que a solicitação seja concedida. O processamento de solicitações de aumento grandes pode levar algum tempo.