Quotas
Este documento descreve os limites de quota para as funções do Cloud Run.
As quotas para funções do Cloud Run abrangem 4 áreas:
Limites de recursos
Estes afetam a quantidade total de recursos que as suas funções podem consumir.
Limites de tempo
Estes fatores afetam a duração da execução.
Limites de velocidade
Estas afetam a taxa à qual pode chamar a API Cloud Run Functions para gerir as suas funções.
Limites de rede
Estas opções afetam a ligação de saída e os limites de instâncias.
Os diferentes tipos de limites são descritos mais detalhadamente abaixo. As diferenças entre os limites das funções do Cloud Run (1.ª geração) e das funções do Cloud Run (2.ª geração) são indicadas quando aplicável.
Limites de recursos
Os limites de recursos afetam a quantidade total de recursos que as suas funções podem consumir. O âmbito regional é por projeto e cada projeto mantém os seus próprios limites.
Quota | Descrição | Limit (1.ª geração) | Limite (2.ª geração) | Pode ser aumentado | Âmbito |
---|---|---|---|---|---|
Número de funções | O número total de funções que podem ser implementadas por região | 1000 | 1000 menos o número de serviços do Cloud Run implementados | Não | por região |
Tamanho máximo da implementação | O tamanho máximo de uma única implementação de função | 100 MB (comprimido) para fontes. 500 MB (não comprimidos) para origens mais módulos. |
N/A | Não | por função |
Tamanho máximo do pedido HTTP não comprimido | Dados enviados para funções HTTP num pedido HTTP | 10MB | 32MB | Não | por invocação |
Tamanho máximo da resposta HTTP não comprimida | Dados enviados de funções HTTP numa resposta HTTP | 10MB | 10 MB para respostas de streaming. 32 MB para respostas não graduais. |
Não | por invocação |
Tamanho máximo do evento para funções orientadas por eventos | Dados enviados em eventos para funções em segundo plano | 10MB | 512 KB para eventos do Eventarc. 10 MB para eventos antigos. |
Não | por evento |
Memória máxima da função | Quantidade de memória que cada instância de função pode usar | 8GiB | 32GiB | Não | por função |
Memória máxima do projeto | Quantidade de memória, em bytes, que um projeto pode usar. É medido pela soma total da memória pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto. | Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. | N/A | Sim | por projeto e região |
CPU máxima do projeto | Quantidade de CPU, em milivCPU, que um projeto pode usar. É medido pela soma total da CPU pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto. | Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. | N/A | Sim | por projeto e região |
Limites de tempo
Quota | Descrição | Limit (1.ª geração) | Limite (2.ª geração) | Pode ser aumentado | Âmbito |
---|---|---|---|---|---|
Duração máxima da função | O período máximo durante o qual uma função pode ser executada antes de ser terminada à força | 540 segundos | 60 minutos para funções HTTP. 60 minutos para funções acionadas por eventos. |
Não | por invocação |
Limites de velocidade
Quota | Descrição | Limit (1.ª geração) | Limite (2.ª geração) | Pode ser aumentado | Âmbito |
---|---|---|---|---|---|
Chamadas da API (LEITURA) | Chamadas para descrever ou listar funções através da API Cloud Run Functions | 5000 por 100 segundos | 1200 por 60 segundos | Apenas para a 1.ª geração | por projeto (1.ª geração) por região (2.ª geração) |
Chamadas da API (ESCRITA) | Chamadas para implementar ou eliminar funções através da API Cloud Run Functions | 80 por 100 segundos | 60 por 60 segundos | Não 1 | por projeto (1.ª geração) por região (2.ª geração) |
Chamadas da API (CALL) | Chamadas para a API "call" | 16 por 100 segundos | N/A | Não 2 | por projeto |
Limites de rede
Para ver informações sobre os limites de largura de banda e de pedidos de rede das funções do Cloud Run (2.ª geração), consulte o artigo Limites de rede.
Os seguintes limites de rede aplicam-se às funções do Cloud Run (1.ª geração):
- Ligações de saída por segundo por instância: 500 (não podem ser aumentadas)
- Resoluções de DNS de saída por segundo por instância: 100 (não podem ser aumentadas)
- Pacotes máximos por segundo por instância: 80 000
- Máximo de bits por segundo por instância: 100 000 000
Escalabilidade
As funções do Cloud Run invocadas por HTTP são dimensionadas rapidamente para processar o tráfego recebido, enquanto as funções em segundo plano são dimensionadas de forma mais gradual. A capacidade de uma função para aumentar a escala é determinada por alguns fatores, incluindo:
- A quantidade de tempo que a execução de uma função demora a ser concluída (geralmente, as funções de execução rápida podem ser dimensionadas para processar mais pedidos simultâneos).
- O tempo que uma função demora a inicializar num início a frio.
- A taxa de erros da sua função.
Fatores transitórios, como a carga regional e a capacidade do centro de dados.
A sua configuração, conforme definida por instâncias mínimas, instâncias máximas e concorrência (a concorrência é apenas para a 2.ª geração).
Quotas adicionais para funções em segundo plano
Quota | Descrição | Limite | Pode ser aumentado | Âmbito | Versão do produto |
---|---|---|---|---|---|
Invocações simultâneas máximas | O número máximo de invocações simultâneas de uma única função Exemplo: se o processamento de cada evento demorar 100 segundos, a taxa de invocação é limitada a 30 por segundo, em média |
3000 | Sim | por função | Apenas 1.ª geração |
Taxa de invocação máxima | A taxa máxima de eventos processados por uma única função Exemplo: se o processamento de um evento demorar 100 ms, a taxa de invocação será limitada a 1000 por segundo, mesmo que apenas 100 pedidos, em média, sejam processados em paralelo |
1000 por segundo | Não | por função | Apenas 1.ª geração |
Tamanho máximo de dados de eventos em simultâneo | O tamanho total máximo dos eventos recebidos para invocações simultâneas de
uma única função Exemplo: se os eventos tiverem um tamanho de 1 MB e o processamento demorar 10 segundos, a taxa média será de 1 evento por segundo, porque o 11.º evento não é processado até que o processamento de um dos primeiros 10 eventos termine |
10MB | Não | por função | 1.ª e 2.ª geração |
Débito máximo de eventos de entrada | A taxa de transferência máxima de eventos recebidos para uma única função Exemplo: se os eventos tiverem um tamanho de 1 MB, a taxa de invocação pode ser de, no máximo, 10 por segundo, mesmo que as funções terminem no prazo de 100 ms |
10 MB por segundo | Não | por função | 1.ª e 2.ª geração |
Quando atinge um limite de quota
Quando uma função consome todos os recursos atribuídos, o recurso fica indisponível até a quota ser atualizada ou aumentada. Isto pode significar que a sua função e todas as outras funções no mesmo projeto não vão funcionar até lá. Uma função devolve um código de erro HTTP 500 quando um dos recursos está acima da quota e a função não pode ser executada.
Para aumentar as quotas acima dos predefinições indicadas aqui, aceda à página Quotas das funções do Cloud Run, selecione as quotas que quer modificar, clique em Editar quotas, faculte as suas informações de utilizador, se lhe for pedido, e introduza o novo limite de quota para cada quota selecionada.