Se estiver a criar uma nova função, consulte o início rápido da consola no Cloud Run.

Esta página foi traduzida pela API Cloud Translation.

Quotas

Este documento descreve os limites de quota para as funções do Cloud Run.

As quotas para funções do Cloud Run abrangem 4 áreas:

Limites de recursos

Estes afetam a quantidade total de recursos que as suas funções podem consumir.
Limites de tempo

Estes fatores afetam a duração da execução.
Limites de velocidade

Estas afetam a taxa à qual pode chamar a API Cloud Run Functions para gerir as suas funções.
Limites de rede

Estas opções afetam a ligação de saída e os limites de instâncias.

Os diferentes tipos de limites são descritos mais detalhadamente abaixo. As diferenças entre os limites das funções do Cloud Run (1.ª geração) e das funções do Cloud Run (2.ª geração) são indicadas quando aplicável.

Limites de recursos

Os limites de recursos afetam a quantidade total de recursos que as suas funções podem consumir. O âmbito regional é por projeto e cada projeto mantém os seus próprios limites.

Quota	Descrição	Limit (1.ª geração)	Limite (2.ª geração)	Pode ser aumentado	Âmbito
Número de funções	O número total de funções que podem ser implementadas por região	1000	1000 menos o número de serviços do Cloud Run implementados	Não	por região
Tamanho máximo da implementação	O tamanho máximo de uma única implementação de função	100 MB (comprimido) para fontes. 500 MB (não comprimidos) para origens mais módulos.	N/A	Não	por função
Tamanho máximo do pedido HTTP não comprimido	Dados enviados para funções HTTP num pedido HTTP	10MB	32MB	Não	por invocação
Tamanho máximo da resposta HTTP não comprimida	Dados enviados de funções HTTP numa resposta HTTP	10MB	10 MB para respostas de streaming. 32 MB para respostas não graduais.	Não	por invocação
Tamanho máximo do evento para funções orientadas por eventos	Dados enviados em eventos para funções em segundo plano	10MB	512 KB para eventos do Eventarc. 10 MB para eventos antigos.	Não	por evento
Memória máxima da função	Quantidade de memória que cada instância de função pode usar	8GiB	32GiB	Não	por função
Memória máxima do projeto	Quantidade de memória, em bytes, que um projeto pode usar. É medido pela soma total da memória pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto.	Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente.	N/A	Sim	por projeto e região
CPU máxima do projeto	Quantidade de CPU, em milivCPU, que um projeto pode usar. É medido pela soma total da CPU pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto.	Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente.	N/A	Sim	por projeto e região

Limites de tempo

Quota	Descrição	Limit (1.ª geração)	Limite (2.ª geração)	Pode ser aumentado	Âmbito
Duração máxima da função	O período máximo durante o qual uma função pode ser executada antes de ser terminada à força	540 segundos	60 minutos para funções HTTP. 60 minutos para funções acionadas por eventos.	Não	por invocação

Limites de velocidade

Quota	Descrição	Limit (1.ª geração)	Limite (2.ª geração)	Pode ser aumentado	Âmbito
Chamadas da API (LEITURA)	Chamadas para descrever ou listar funções através da API Cloud Run Functions	5000 por 100 segundos	1200 por 60 segundos	Apenas para a 1.ª geração	por projeto (1.ª geração) por região (2.ª geração)
Chamadas da API (ESCRITA)	Chamadas para implementar ou eliminar funções através da API Cloud Run Functions	80 por 100 segundos	60 por 60 segundos	Não ¹	por projeto (1.ª geração) por região (2.ª geração)
Chamadas da API (CALL)	Chamadas para a API "call"	16 por 100 segundos	N/A	Não ²	por projeto

Limites de rede

Para ver informações sobre os limites de largura de banda e de pedidos de rede das funções do Cloud Run (2.ª geração), consulte o artigo Limites de rede.

Os seguintes limites de rede aplicam-se às funções do Cloud Run (1.ª geração):

Ligações de saída por segundo por instância: 500 (não podem ser aumentadas)
Resoluções de DNS de saída por segundo por instância: 100 (não podem ser aumentadas)
Pacotes máximos por segundo por instância: 80 000
Máximo de bits por segundo por instância: 100 000 000

Escalabilidade

As funções do Cloud Run invocadas por HTTP são dimensionadas rapidamente para processar o tráfego recebido, enquanto as funções em segundo plano são dimensionadas de forma mais gradual. A capacidade de uma função para aumentar a escala é determinada por alguns fatores, incluindo:

A quantidade de tempo que a execução de uma função demora a ser concluída (geralmente, as funções de execução rápida podem ser dimensionadas para processar mais pedidos simultâneos).
O tempo que uma função demora a inicializar num início a frio.
A taxa de erros da sua função.
Fatores transitórios, como a carga regional e a capacidade do centro de dados.
A sua configuração, conforme definida por instâncias mínimas, instâncias máximas e concorrência (a concorrência é apenas para a 2.ª geração).

As funções em segundo plano têm limites adicionais, conforme explicado abaixo. Estes limites não se aplicam às funções HTTP de 1.ª geração. O limite máximo de instâncias predefinido para as funções HTTP de 2.ª geração é 100 e pode ser aumentado para 1000. Não existe um limite máximo de instâncias predefinido para funções HTTP de 1.ª geração. Para evitar eventos de escalabilidade ilimitados com funções HTTP de 1.ª geração, recomendamos que defina um limite, por exemplo, 3000.

Quotas adicionais para funções em segundo plano

Quota	Descrição	Limite	Pode ser aumentado	Âmbito	Versão do produto
Invocações simultâneas máximas	O número máximo de invocações simultâneas de uma única função Exemplo: se o processamento de cada evento demorar 100 segundos, a taxa de invocação é limitada a 30 por segundo, em média	3000	Sim	por função	Apenas 1.ª geração
Taxa de invocação máxima	A taxa máxima de eventos processados por uma única função Exemplo: se o processamento de um evento demorar 100 ms, a taxa de invocação será limitada a 1000 por segundo, mesmo que apenas 100 pedidos, em média, sejam processados em paralelo	1000 por segundo	Não	por função	Apenas 1.ª geração
Tamanho máximo de dados de eventos em simultâneo	O tamanho total máximo dos eventos recebidos para invocações simultâneas de uma única função Exemplo: se os eventos tiverem um tamanho de 1 MB e o processamento demorar 10 segundos, a taxa média será de 1 evento por segundo, porque o 11.º evento não é processado até que o processamento de um dos primeiros 10 eventos termine	10MB	Não	por função	1.ª e 2.ª geração
Débito máximo de eventos de entrada	A taxa de transferência máxima de eventos recebidos para uma única função Exemplo: se os eventos tiverem um tamanho de 1 MB, a taxa de invocação pode ser de, no máximo, 10 por segundo, mesmo que as funções terminem no prazo de 100 ms	10 MB por segundo	Não	por função	1.ª e 2.ª geração

Quando atinge um limite de quota

Quando uma função consome todos os recursos atribuídos, o recurso fica indisponível até a quota ser atualizada ou aumentada. Isto pode significar que a sua função e todas as outras funções no mesmo projeto não vão funcionar até lá. Uma função devolve um código de erro HTTP 500 quando um dos recursos está acima da quota e a função não pode ser executada.

Para aumentar as quotas acima dos predefinições indicadas aqui, aceda à página Quotas das funções do Cloud Run, selecione as quotas que quer modificar, clique em Editar quotas, faculte as suas informações de utilizador, se lhe for pedido, e introduza o novo limite de quota para cada quota selecionada.