Quotas

Este documento descreve os limites de quota para as funções do Cloud Run.

As quotas para funções do Cloud Run abrangem 4 áreas:

  • Limites de recursos

    Estes afetam a quantidade total de recursos que as suas funções podem consumir.

  • Limites de tempo

    Estes fatores afetam a duração da execução.

  • Limites de velocidade

    Estas afetam a taxa à qual pode chamar a API Cloud Run Functions para gerir as suas funções.

  • Limites de rede

    Estas opções afetam a ligação de saída e os limites de instâncias.

Os diferentes tipos de limites são descritos mais detalhadamente abaixo. As diferenças entre os limites das funções do Cloud Run (1.ª geração) e das funções do Cloud Run (2.ª geração) são indicadas quando aplicável.

Limites de recursos

Os limites de recursos afetam a quantidade total de recursos que as suas funções podem consumir. O âmbito regional é por projeto e cada projeto mantém os seus próprios limites.

Quota Descrição Limit (1.ª geração) Limite (2.ª geração) Pode ser aumentado Âmbito
Número de funções O número total de funções que podem ser implementadas por região 1000 1000 menos o número de serviços do Cloud Run implementados Não por região
Tamanho máximo da implementação O tamanho máximo de uma única implementação de função 100 MB (comprimido) para fontes.
500 MB (não comprimidos) para origens mais módulos.
N/A Não por função
Tamanho máximo do pedido HTTP não comprimido Dados enviados para funções HTTP num pedido HTTP 10MB 32MB Não por invocação
Tamanho máximo da resposta HTTP não comprimida Dados enviados de funções HTTP numa resposta HTTP 10MB 10 MB para respostas de streaming.
32 MB para respostas não graduais.
Não por invocação
Tamanho máximo do evento para funções orientadas por eventos Dados enviados em eventos para funções em segundo plano 10MB 512 KB para eventos do Eventarc.
10 MB para eventos antigos.
Não por evento
Memória máxima da função Quantidade de memória que cada instância de função pode usar 8GiB 32GiB Não por função
Memória máxima do projeto Quantidade de memória, em bytes, que um projeto pode usar. É medido pela soma total da memória pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto. Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. N/A Sim por projeto e região
CPU máxima do projeto Quantidade de CPU, em milivCPU, que um projeto pode usar. É medido pela soma total da CPU pedida pelo utilizador em todas as instâncias de funções durante um período de 1 minuto. Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. N/A Sim por projeto e região

Limites de tempo

Quota Descrição Limit (1.ª geração) Limite (2.ª geração) Pode ser aumentado Âmbito
Duração máxima da função O período máximo durante o qual uma função pode ser executada antes de ser terminada à força 540 segundos 60 minutos para funções HTTP.
60 minutos para funções acionadas por eventos.
Não por invocação

Limites de velocidade

Quota Descrição Limit (1.ª geração) Limite (2.ª geração) Pode ser aumentado Âmbito
Chamadas da API (LEITURA) Chamadas para descrever ou listar funções através da API Cloud Run Functions 5000 por 100 segundos 1200 por 60 segundos Apenas para a 1.ª geração por projeto (1.ª geração)
por região (2.ª geração)
Chamadas da API (ESCRITA) Chamadas para implementar ou eliminar funções através da API Cloud Run Functions 80 por 100 segundos 60 por 60 segundos Não 1 por projeto (1.ª geração)
por região (2.ª geração)
Chamadas da API (CALL) Chamadas para a API "call" 16 por 100 segundos N/A Não 2 por projeto

Limites de rede

Para ver informações sobre os limites de largura de banda e de pedidos de rede das funções do Cloud Run (2.ª geração), consulte o artigo Limites de rede.

Os seguintes limites de rede aplicam-se às funções do Cloud Run (1.ª geração):

  • Ligações de saída por segundo por instância: 500 (não podem ser aumentadas)
  • Resoluções de DNS de saída por segundo por instância: 100 (não podem ser aumentadas)
  • Pacotes máximos por segundo por instância: 80 000
  • Máximo de bits por segundo por instância: 100 000 000

Escalabilidade

As funções do Cloud Run invocadas por HTTP são dimensionadas rapidamente para processar o tráfego recebido, enquanto as funções em segundo plano são dimensionadas de forma mais gradual. A capacidade de uma função para aumentar a escala é determinada por alguns fatores, incluindo:

  • A quantidade de tempo que a execução de uma função demora a ser concluída (geralmente, as funções de execução rápida podem ser dimensionadas para processar mais pedidos simultâneos).
  • O tempo que uma função demora a inicializar num início a frio.
  • A taxa de erros da sua função.
  • Fatores transitórios, como a carga regional e a capacidade do centro de dados.

  • A sua configuração, conforme definida por instâncias mínimas, instâncias máximas e concorrência (a concorrência é apenas para a 2.ª geração).

As funções em segundo plano têm limites adicionais, conforme explicado abaixo. Estes limites não se aplicam às funções HTTP de 1.ª geração. O limite máximo de instâncias predefinido para as funções HTTP de 2.ª geração é 100 e pode ser aumentado para 1000. Não existe um limite máximo de instâncias predefinido para funções HTTP de 1.ª geração. Para evitar eventos de escalabilidade ilimitados com funções HTTP de 1.ª geração, recomendamos que defina um limite, por exemplo, 3000.

Quotas adicionais para funções em segundo plano

Quota Descrição Limite Pode ser aumentado Âmbito Versão do produto
Invocações simultâneas máximas O número máximo de invocações simultâneas de uma única função
Exemplo: se o processamento de cada evento demorar 100 segundos, a taxa de invocação é limitada a 30 por segundo, em média
3000 Sim por função Apenas 1.ª geração
Taxa de invocação máxima A taxa máxima de eventos processados por uma única função
Exemplo: se o processamento de um evento demorar 100 ms, a taxa de invocação será limitada a 1000 por segundo, mesmo que apenas 100 pedidos, em média, sejam processados em paralelo
1000 por segundo Não por função Apenas 1.ª geração
Tamanho máximo de dados de eventos em simultâneo O tamanho total máximo dos eventos recebidos para invocações simultâneas de uma única função
Exemplo: se os eventos tiverem um tamanho de 1 MB e o processamento demorar 10 segundos, a taxa média será de 1 evento por segundo, porque o 11.º evento não é processado até que o processamento de um dos primeiros 10 eventos termine
10MB Não por função 1.ª e 2.ª geração
Débito máximo de eventos de entrada A taxa de transferência máxima de eventos recebidos para uma única função
Exemplo: se os eventos tiverem um tamanho de 1 MB, a taxa de invocação pode ser de, no máximo, 10 por segundo, mesmo que as funções terminem no prazo de 100 ms
10 MB por segundo Não por função 1.ª e 2.ª geração

Quando atinge um limite de quota

Quando uma função consome todos os recursos atribuídos, o recurso fica indisponível até a quota ser atualizada ou aumentada. Isto pode significar que a sua função e todas as outras funções no mesmo projeto não vão funcionar até lá. Uma função devolve um código de erro HTTP 500 quando um dos recursos está acima da quota e a função não pode ser executada.

Para aumentar as quotas acima dos predefinições indicadas aqui, aceda à página Quotas das funções do Cloud Run, selecione as quotas que quer modificar, clique em Editar quotas, faculte as suas informações de utilizador, se lhe for pedido, e introduza o novo limite de quota para cada quota selecionada.