Veja nesta página as cotas e limites de uso que se aplicam ao Cloud Run.
O número de recursosdo Cloud Run é limitado. As cotas do Cloud Run incluem os limites de taxa da API, o que afeta o valor de chamada da API Cloud Run Admin.
Não há limite direto para:
- o tamanho das imagens do contêiner que é possível implantar;
- o número de solicitações simultâneas exibidas por um serviço do Cloud Run.
Limites de recursos para o Cloud Run
Para ultrapassar os limites que podem ser aumentados, solicite um aumento de cota. Para ultrapassar os limites por projeto que não podem ser aumentados, crie novos recursos em um projeto ou região diferente do Google Cloud.
Recurso | Escopo | Descrição | Limite | Pode aumentar? |
---|---|---|---|---|
Serviço | por projeto e região | Número máximo de serviços | 1.000 | Não |
Job | por projeto e região | Número máximo de jobs | 1000 | Não |
Execução do trabalho | por projeto e região | Número máximo de jobs em execução | 1000 | Não |
Revisão | por serviço | Número máximo de revisões por serviço. Quando o limite for atingido, as revisões não veiculadas serão excluídas automaticamente a partir das mais antigas | 1.000 | Não |
Revisão | por projeto e região | Número máximo de revisões que exibem o tráfego | 4000 | Não |
Tag de revisão | por projeto e região | Número máximo de tags de revisão. Quando o limite de tags de revisão é excedido, o Cloud Run executa a limpeza de tags no serviço. No caso do serviço em que uma nova tag está sendo criada, as tags que não têm uma porcentagem de tráfego especificada são excluídas automaticamente na ordem histórica. | 2000 | Não |
Execução do trabalho | por job | Limite de retenção para execuções de job concluídas. Quando o número de execuções completas de um job atinge esse limite, elas são excluídas automaticamente em ordem histórica. | 1.000 | Não |
Tarefa de execução do job1 | por execução de job | Número máximo de tarefas em execução em paralelo | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim |
Tarefa de execução do job | por execução de job | Valor de tempo limite máximo de tarefas | 24 horas | Não |
Tarefa de execução do job | por execução de job | Número máximo de tarefas em um único job | 10.000 | Não |
Tarefa de execução do job | por execução de job | Número máximo de novas tentativas de tarefas em um job | 10 | Não |
Variáveis de ambiente | por job ou por serviço | Número máximo de variáveis de ambiente para cada contêiner | 1000 | Não |
Argumentos do comando | por job ou por serviço | Número máximo de argumentos de comando para cada contêiner | 1000 | Não |
Instância de contêiner1 | por revisão | Número máximo de instâncias de contêiner | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim |
Instância de contêiner1 | por projeto e região | Número máximo de instâncias de contêiner de todas as execuções do job em execução | Depende das configurações de CPU e memória selecionadas. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim |
Instância de contêiner2 | por revisão e região | Número máximo de instâncias de contêiner que usam a saída de VPC direta | 100 a 200, dependendo das configurações de região selecionadas. | Sim |
Instância de contêiner | por instância de contêiner | Tempo limite de inicialização, em minutos | 4 | Não |
Memória | por instância de contêiner | Tamanho máximo da memória, em GiB | 32 | Não |
CPU | por instância de contêiner | Número máximo de vCPU | 8 | Não |
CPU | por projeto e região | Total máximo de CPU, em mili vCPU, alocado em todas as instâncias em um período de 1 minuto. | Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim |
Memória | por projeto e região | Memória total máxima, em bytes, alocada em todas as instâncias em um período de 1 minuto. | Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente. | Sim |
Instância de GPU3 | por projeto e por região | Número máximo de instâncias de contêiner com GPU | 03 | Sim |
Disco | por instância de contêiner | Sistema de arquivos em memória gravável máximo, limitado pela memória da instância, em GiB | 32 | Não |
Variável de ambiente | por variável | Comprimento máximo da variável, em KB | 32 | Não |
Mapeamento de domínios | por domínio superior e por semana | Número máximo de certificados SSL | 50 | Não |
Mapeamento de domínios | por domínio superior e por semana | Número máximo de certificados SSL duplicados | 5 | Não |
Token de acesso | por instância de contêiner/segundo | Número máximo de tokens de acesso exclusivos gerados | 50 | Não |
Token de identidade | por instância de contêiner/segundo | Número máximo de tokens de identidade exclusivos gerados | 50 | Não |
Arquivos abertos | por instância de contêiner | Número máximo de arquivos que podem ser abertos ao mesmo tempo. Corresponde a /proc/sys/fs/file-max . |
25.000 | Não |
1Essa cota regional é usada em alguns casos:
Ela controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.
Ele controla o paralelismo máximo de um job. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.
Ele controla o total de instâncias de contêiner para executar execuções de job em uma região.
2Essa cota regional é usada em alguns casos:
Ele controla o valor máximo que pode ser escolhido para o atributo máximo de instância de uma revisão usando a saída de VPC direta. Depois de concedido em uma determinada região, todas as revisões dessa região podem ir até o limite concedido.
Ele controla o paralelismo máximo de um job usando a saída de VPC direta. Depois de concedido em uma determinada região, todos os jobs dessa região podem ir até o limite concedido.
3
Para acessar a GPU, solicite um aumento de cota para Total Nvidia L4 GPU allocation, per project per region
.
Limites de rede para o Cloud Run
Limites de solicitação do Cloud Run
Descrição | Limite | Observações |
---|---|---|
Número máximo de solicitações simultâneas por instância | 1000 | |
Número máximo de streams simultâneos por conexão de cliente HTTP/2 | 100 | |
Tempo máximo antes do tempo limite por solicitação | 60 minutos | |
Tamanho máximo da solicitação HTTP/1 | 32 MiB se estiver usando o servidor HTTP/1. Sem limite se estiver usando o servidor HTTP/2. | |
Tamanho máximo da resposta HTTP/1 | 32 MiB se não estiver usando Transfer-Encoding: chunked ou mecanismos de streaming |
|
Conexões de saída por segundo por instância | 700 | |
Resoluções de DNS de saída por segundo por instância | 1000 | |
Solicitações de entrada por segundo para uma porta de contêiner HTTP/1 por instância | 800 | Não se aplica a portas de contêiner HTTP/2. |
Limites de largura de banda para o Cloud Run
Os seguintes limites de largura de banda se aplicam a instâncias do Cloud Run:
Descrição | Limite | Observações |
---|---|---|
Máximo de bits por instância para saída por VPC direta | 1 Gbps | Saída pela saída VPC direta para destinos na rede VPC. |
Máximo de bits por instância, exceto a saída por VPC direta | 600 Mbps | Com base na soma dos bits de entrada e de saída, excluindo a saída por saída VPC direta para destinos na rede VPC. |
Taxa total máxima de pacotes por instância, excluindo a saída por VPC direta | 64.000 pacotes por segundo | Com base na soma dos pacotes de entrada e de saída, excluindo a saída por saída VPC direta para destinos na rede VPC. |
Se um dos dois limites for atingido, a instância do Cloud Run terá largura de banda limitada.
Limitações de taxa da API Cloud Run Admin
As seguintes limitações de taxa se aplicam à API Cloud Run Admin. Eles não se aplicam às solicitações que chegam aos serviços implantados do Cloud Run.
Cota | Descrição | Limite | Pode aumentar? | Escopo |
---|---|---|---|---|
Solicitações de leitura da API Cloud Run Admin | O número de leituras da API por 60 segundos/projeto. Esse valor não representa o número de solicitações de leitura para os serviços do Cloud Run, o que não é limitado. | 3.000 a cada 60 segundos | Sim | por projeto e região |
Solicitações de gravação da API Cloud Run Admin | O número de gravações da API por 60 segundos. Esse valor não representa o número de solicitações de gravação para os serviços do Cloud Run, o que não é limitado. | 180 a cada 60 segundos | Sim | por projeto e região |
Execução do job | Número máximo de vezes que um job pode ser executado a cada 60 segundos por região. | 180 a cada 60 segundos | Sim | por projeto e região |
Como aumentar a cota
Para solicitar um valor de cota maior, siga estas etapas:Acesse a página Cotas e limites do sistema:
Localize a cota que você quer aumentar na coluna Cota. Use a caixa de pesquisa Filtro para procurar sua cota.
Marque a caixa de seleção ao lado da cota que você quer aumentar.
Clique em
. A caixa de diálogo Mudanças de cota é exibida. Editar Opcional: se você quiser aumentar o valor da cota além do número indicado na tela, selecione Inscrever-se para uma cota maior. Preencha o formulário, envie e pule as etapas restantes.
No formulário Mudanças de cota, insira a cota maior que você quer no campo Novo valor. Se um campo Descrição da solicitação aparecer, insira uma descrição. Clique em Concluído.
Ao encontrar uma caixa com o texto Entendo que esta solicitação vai remover todas as substituições, isso significa que o valor da cota está definido abaixo do padrão. Ajustar o valor da cota para o padrão ou além dele remove a substituição. Para continuar, marque a caixa. Saiba mais sobre substituições de cotas.
Se um botão Avançar aparecer, clique nele e preencha as informações de contato na tela seguinte.
Clique em Enviar solicitação.
Se você não conseguir solicitar um ajuste no console, peça o aumento ao Cloud Customer Care.
As solicitações de ajuste de cotas do Cloud estão sujeitas a revisão. Se o pedido de ajuste de cota exigir análise, você vai receber um e-mail confirmando o recebimento da solicitação. Se precisar de mais ajuda, responda ao e-mail. Depois de analisar sua solicitação, você vai receber uma notificação por e-mail indicando se ela foi aprovada.
Para saber mais sobre como o processo de aumento de cota funciona, consulte Sobre solicitações de aumento de cota.
Solicitações em lote para valores de cota mais altos
É possível agrupar solicitações para uma cota maior selecionando a caixa de seleção ao lado de cada cota que você quer incluir. As solicitações em lote podem aumentar o tempo que o Google Cloud leva para analisar sua solicitação. Para reduzir o tempo de análise, agrupe as solicitações de ajuste de cota por produto e área. Por exemplo, se você quiser solicitar ajustes nas cotas de rede e de VM do Compute Engine, crie uma solicitação para as cotas de rede e outra para as cotas de VM do Compute Engine.