Para simplificar las búsquedas y mejorar la experiencia de documentación, dividimos la documentación de 1ª gen. y 2ª gen. en conjuntos separados.

Cuotas

En este documento, se describen los límites de cuota de Google Cloud Functions.

Las cuotas de Google Cloud Functions abarcan 3 áreas:

Límites de recursos

Afectan la cantidad total de recursos que pueden consumir tus funciones.
Límites de tiempo

Afectan el tiempo de ejecución de los recursos.
Límites de frecuencia

Estos afectan la frecuencia con la que puedes llamar a la API de Cloud Functions para administrar las funciones.

Los diferentes tipos de límites se describen con más detalles a continuación. Se aplican las diferencias entre los límites de Cloud Functions (1st gen) y Cloud Functions (2nd gen) cuando corresponda.

Límites de recursos

Los límites afectan la cantidad total de recursos que pueden consumir tus funciones. El alcance regional es por proyecto, y cada proyecto tiene sus propios límites.

Cuota	Descripción	Límite (1st gen)	Límite (2nd gen)	Se puede aumentar	Permiso
Cantidad de funciones	La cantidad total de funciones que se pueden implementar por región	1,000	1,000 menos la cantidad de servicios de Cloud Run que se implementaron	No	por región
Tamaño máximo de implementación	Tamaño máximo de la implementación de una sola función	100 MB (comprimida) para fuentes 500 MB (sin comprimir) para fuentes más módulos	N/A	No	Por función
Tamaño máximo de solicitudes HTTP sin comprimir	Datos enviados a funciones de HTTP en una solicitud HTTP	10 MB	32 MB	No	Por invocación
Tamaño máximo de respuesta HTTP sin comprimir	Datos enviados desde funciones de HTTP en una respuesta HTTP	10 MB	10 MB para respuestas de transmisión 32 MB para respuestas sin transmisión	No	Por invocación
Tamaño máximo de evento para funciones controladas por eventos	Datos enviados en eventos a funciones en segundo plano	10 MB	512 KB para eventos de Eventarc 10 MB para eventos heredados	No	Por evento
Memoria máxima de la función	Cantidad de memoria que puede usar cada instancia de la función	8 GiB	32 GiB	No.	Por función

Límites de tiempo

Cuota	Descripción	Límite (1st gen)	Límite (2nd gen)	Se puede aumentar	Permiso
Duración máx. de la función	El tiempo máximo que una función se puede ejecutar antes de que se fuerce su cierre	540 segundos	60 minutos para las funciones de HTTP 9 minutos para funciones controladas por eventos.	No.	Por invocación

Límites de frecuencia

Cuota	Descripción	Límite (1st gen)	Límite (2nd gen)	Se puede aumentar	Permiso
Llamadas a la API (LECTURA)	Llamadas para describir o mostrar funciones a través de la API de Cloud Functions	5,000 cada 100 segundos	1,200 cada 60 segundos	Solo para 1st gen	Por proyecto (1st gen) Por región (2nd gen)
Llamadas a la API (WRITE)	Llamadas para implementar o borrar funciones a través de la API de Cloud Functions	80 cada 100 segundos	60 cada 60 segundos	No¹	Por proyecto (1st gen) Por región (2nd gen)
Llamadas a la API (CALL)	Llamadas a la API “de llamada”	16 cada 100 segundos	N/A	No²	Por proyecto

Escalabilidad

Las funciones de Cloud Functions invocadas por HTTP escalan rápidamente para procesar el tráfico entrante, mientras que las funciones en segundo plano escalan de manera más gradual. Varios factores determinan la capacidad de escalamiento de las funciones, incluidos los siguientes:

El tiempo que tarda la ejecución completa de una función (aquellas más breves suelen escalar verticalmente para procesar más solicitudes simultáneas)
El tiempo que tarda el inicio en frío de una función
La tasa de errores de la función
Factores transitorios, como la carga regional y la capacidad del centro de datos
La configuración definida por las instancias mínimas, las instancias máximas y la simultaneidad (la simultaneidad es solo de 2a gen.).

Las funciones en segundo plano tienen límites adicionales, como se explica a continuación. Estos límites no se aplican a las funciones de HTTP de 1a gen. El límite máximo de instancias predeterminadas para las funciones de HTTP de segunda generación es de 100 y se puede aumentar a 1,000. No hay un límite máximo de instancias predeterminadas para las funciones de HTTP de 1ª gen. Para evitar eventos de escalamiento ilimitados con funciones de HTTP de 1ª gen, te recomendamos que establezcas un límite, por ejemplo, 3,000.

Cuotas adicionales para las funciones en segundo plano

Cuota	Descripción	Límite	Se puede aumentar	Alcance	Versión del producto
Cantidad máxima de invocaciones simultáneas	La cantidad máxima de invocaciones simultáneas de una sola función Ejemplo: Si controlar cada evento tarda 100 segundos, la frecuencia de invocación se limitará a 30 por segundo en promedio.	3,000	Sí	Por función	Solo para la 1ª gen.
Frecuencia de invocación máxima	La frecuencia máxima de los eventos que controla una sola función Ejemplo: Si se tardan 100 ms en manejar un evento, la frecuencia de invocación se limitará a 1,000 por segundo, incluso si solo se manejan 100 solicitudes simultáneas en promedio.	1,000 por segundo	No	Por función	Solo para la 1ª gen.
Tamaño máximo de datos de eventos simultáneos	El tamaño total máximo de los eventos entrantes a las invocaciones simultáneas de una sola función Ejemplo: Si los eventos tienen 1 MB de tamaño y tardan 10 segundos en procesarse, la frecuencia promedio será 1 evento por segundo, dado que no se procesará el 11º evento hasta que se termine de procesar uno de los 10 primeros.	10 MB	No	Por función	1ª gen y 2ª gen.
Capacidad de procesamiento máxima de los eventos entrantes	La capacidad de procesamiento máxima de los eventos entrantes a una sola función Ejemplo: Si los eventos tienen 1 MB de tamaño, la frecuencia de invocación máxima puede ser de 10 por segundo, incluso si las funciones finalizan en un plazo de 100 ms.	10 MB por segundo	No	Por función	1ª gen y 2ª gen.

Qué ocurre cuando alcanzas el límite de una cuota

Cuando una función consume por completo un recurso asignado, este deja de estar disponible hasta que aumente o se renueve la cuota. Así, es posible que no se ejecute tu función ni ninguna otra en el mismo proyecto hasta entonces. Una función muestra un código de error HTTP 500 cuando se supera la cuota de uno de los recursos y no se puede ejecutar la función.

Si quieres aumentar las cuotas por sobre los valores predeterminados que se indican aquí, ve a la página de cuotas de Cloud Functions y selecciona las cuotas que quieras modificar. Luego, haz clic en EDITAR CUOTAS, proporciona tu información de usuario si se te la solicita y, por último, ingresa el límite nuevo para cada cuota que hayas seleccionado.