Cuotas

En este documento, se describen los límites de cuota de Cloud Run Functions.

Las cuotas de Cloud Run Functions abarcan 4 áreas:

  • Límites de recursos

    Afectan la cantidad total de recursos que pueden consumir tus funciones.

  • Límites de tiempo

    Afectan el tiempo de ejecución de los recursos.

  • Límites de frecuencia

    Afectan la frecuencia con la que puedes llamar a la API de Cloud Run Functions para administrar las funciones.

  • Límites de red

    Afectan los límites de instancias y conexiones salientes.

Los diferentes tipos de límites se describen con más detalles a continuación. Se aplican las diferencias entre los límites de las funciones de Cloud Run (1ª gen.) y las funciones de Cloud Run (2ª gen.) cuando corresponda.

Límites de recursos

Los límites afectan la cantidad total de recursos que pueden consumir tus funciones. El alcance regional es por proyecto, y cada proyecto tiene sus propios límites.

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Cantidad de funciones La cantidad total de funciones que se pueden implementar por región 1,000 1,000 menos la cantidad de servicios de Cloud Run que se implementaron No por región
Tamaño máximo de implementación Tamaño máximo de la implementación de una sola función 100 MB (comprimida) para fuentes
500 MB (sin comprimir) para fuentes más módulos
N/A No Por función
Tamaño máximo de solicitudes HTTP sin comprimir Datos enviados a funciones de HTTP en una solicitud HTTP 10 MB 32 MB No Por invocación
Tamaño máximo de respuesta HTTP sin comprimir Datos enviados desde funciones de HTTP en una respuesta HTTP 10 MB 10 MB para respuestas de transmisión
32 MB para respuestas sin transmisión
No Por invocación
Tamaño máximo de evento para funciones controladas por eventos Datos enviados en eventos a funciones en segundo plano 10 MB 512 KB para eventos de Eventarc
10 MB para eventos heredados
No Por evento
Memoria máxima de la función Cantidad de memoria que puede usar cada instancia de la función 8 GiB 32 GiB No Por función
Memoria máxima del proyecto Es la cantidad de memoria, en bytes, que puede usar un proyecto. Se mide por la suma total de la memoria solicitada por el usuario en las instancias de la función durante un período de 1 minuto. Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. N/A por proyecto y región
CPU máxima del proyecto Es la cantidad de CPU, en mili CPU virtual, que puede usar un proyecto. Se mide por la suma total de la CPU solicitada por el usuario en las instancias de la función durante un período de 1 minuto. Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. N/A por proyecto y región

Límites de tiempo

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Duración máxima de la función El tiempo máximo que una función se puede ejecutar antes de que se fuerce su cierre 540 segundos 60 minutos para las funciones de HTTP
9 minutos para funciones controladas por eventos.
No Por invocación

Límites de frecuencia

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Llamadas a la API (LECTURA) Llamadas para describir o mostrar funciones a través de la API de Cloud Run Functions 5,000 cada 100 segundos 1,200 cada 60 segundos Solo para 1st gen Por proyecto (1st gen)
Por región (2nd gen)
Llamadas a la API (ESCRITURA) Llamadas para implementar o borrar funciones a través de la API de Cloud Run Functions 80 cada 100 segundos 60 cada 60 segundos No1 Por proyecto (1st gen)
Por región (2nd gen)
Llamadas a la API (CALL) Llamadas a la API “de llamada” 16 cada 100 segundos N/A No2 Por proyecto

Límites de red

Para obtener información sobre las solicitudes de red y los límites de ancho de banda de las funciones de Cloud Run (2ª gen.), consulta Límites de red.

Los siguientes límites de red se aplican a las funciones de Cloud Run (1ª gen.):

  • Conexiones salientes por segundo por instancia: 500 (no se puede aumentar)
  • Resoluciones de DNS salientes por segundo por instancia: 100 (no se puede aumentar)

Escalabilidad

Las funciones de Cloud Run Functions invocadas por HTTP escalan rápidamente para procesar el tráfico entrante, mientras que las funciones en segundo plano escalan de manera más gradual. Varios factores determinan la capacidad de escalamiento de las funciones, incluidos los siguientes:

  • El tiempo que tarda la ejecución completa de una función (aquellas más breves suelen escalar verticalmente para procesar más solicitudes simultáneas)
  • El tiempo que tarda el inicio en frío de una función
  • La tasa de errores de la función
  • Factores transitorios, como la carga regional y la capacidad del centro de datos

  • La configuración definida por las instancias mínimas, las instancias máximas y la simultaneidad (la simultaneidad es solo de 2a gen.).

Las funciones en segundo plano tienen límites adicionales, como se explica a continuación. Estos límites no se aplican a las funciones de HTTP de 1a gen. El límite máximo de instancias predeterminadas para las funciones de HTTP de 2ª gen. es de 100 y se puede aumentar a 1,000. No hay un límite máximo de instancias predeterminadas para las funciones de HTTP de 1ª gen. Para evitar eventos de escalamiento ilimitados con funciones de HTTP de 1ª gen, te recomendamos que establezcas un límite, por ejemplo, 3,000.

Cuotas adicionales para las funciones en segundo plano

Cuota Descripción Límite Se puede aumentar Alcance Versión del producto
Cantidad máxima de invocaciones simultáneas La cantidad máxima de invocaciones simultáneas de una sola función
Ejemplo: Si controlar cada evento tarda 100 segundos, la frecuencia de invocación se limitará a 30 por segundo en promedio.
3,000 Por función Solo para la 1ª gen.
Frecuencia de invocación máxima La frecuencia máxima de los eventos que controla una sola función
Ejemplo: Si se tardan 100 ms en manejar un evento, la frecuencia de invocación se limitará a 1,000 por segundo, incluso si solo se manejan 100 solicitudes simultáneas en promedio.
1,000 por segundo No Por función Solo para la 1ª gen.
Tamaño máximo de datos de eventos simultáneos El tamaño total máximo de los eventos entrantes a las invocaciones simultáneas de una sola función
Ejemplo: Si los eventos tienen 1 MB de tamaño y tardan 10 segundos en procesarse, la frecuencia promedio será 1 evento por segundo, dado que no se procesará el 11º evento hasta que se termine de procesar uno de los 10 primeros.
10 MB No Por función 1ª gen y 2ª gen.
Capacidad de procesamiento máxima de los eventos entrantes La capacidad de procesamiento máxima de los eventos entrantes a una sola función
Ejemplo: Si los eventos tienen 1 MB de tamaño, la frecuencia de invocación máxima puede ser de 10 por segundo, incluso si las funciones finalizan en un plazo de 100 ms.
10 MB por segundo No Por función 1ª gen y 2ª gen.

Qué ocurre cuando alcanzas el límite de una cuota

Cuando una función consume por completo un recurso asignado, este deja de estar disponible hasta que aumente o se renueve la cuota. Así, es posible que no se ejecute tu función ni ninguna otra en el mismo proyecto hasta entonces. Una función muestra un código de error HTTP 500 cuando se supera la cuota de uno de los recursos y no se puede ejecutar la función.

Si quieres aumentar las cuotas por sobre los valores predeterminados que se indican aquí, ve a la página de cuotas de Cloud Run Functions, selecciona las cuotas que quieras modificar, haz clic en Editar cuotas, proporciona tu información de usuario si se te la solicita y, por último, ingresa el límite nuevo para cada cuota que hayas seleccionado.