Cuotas

En este documento, se describen los límites de cuota de Google Cloud Functions.

Las cuotas de Google Cloud Functions abarcan 3 áreas:

  • Límites de recursos

    Afectan la cantidad total de recursos que pueden consumir tus funciones.

  • Límites de tiempo

    Afectan el tiempo de ejecución de los recursos.

  • Límites de frecuencia

    Afectan la frecuencia con la que puedes llamar a la API de Cloud Functions o la frecuencia con la que se pueden usar los recursos. Puedes considerar las cuotas de frecuencia como "recursos en el tiempo".

Los diferentes tipos de límites se describen con más detalles a continuación. Se aplican las diferencias entre los límites de Cloud Functions (1st gen) y Cloud Functions (2nd gen) cuando corresponda.

Límites de recursos

Los límites afectan la cantidad total de recursos que pueden consumir tus funciones. El alcance regional es por proyecto, y cada proyecto tiene sus propios límites.

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Cantidad de funciones La cantidad total de funciones que se pueden implementar por región 1,000 1,000 menos la cantidad de servicios de Cloud Run que se implementaron No por región
Tamaño máximo de implementación Tamaño máximo de la implementación de una sola función 100 MB (comprimida) para fuentes
500 MB (sin comprimir) para fuentes más módulos
N/A No Por función
Tamaño máximo de solicitudes HTTP sin comprimir Datos enviados a funciones de HTTP en una solicitud HTTP 10 MB 32 MB No Por invocación
Tamaño máximo de respuesta HTTP sin comprimir Datos enviados desde funciones de HTTP en una respuesta HTTP 10 MB 10 MB para respuestas de transmisión
32 MB para respuestas sin transmisión
No Por invocación
Tamaño máximo de evento para funciones controladas por eventos Datos enviados en eventos a funciones en segundo plano 10 MB 512 KB para eventos de Eventarc
10 MB para eventos heredados
No Por evento
Memoria máxima de la función Cantidad de memoria que puede usar cada instancia de la función 8 GiB 16 GiB No Por función

Límites de tiempo

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Duración máx. de la función El tiempo máximo que una función se puede ejecutar antes de que se fuerce su cierre 540 segundos 60 minutos para las funciones de HTTP
10 minutos para funciones controladas por eventos
No Por invocación

Límites de frecuencia

Cuota Descripción Límite (1st gen) Límite (2nd gen) Se puede aumentar Permiso
Llamadas a la API (LECTURA) Llamadas para describir o mostrar funciones a través de la API de Cloud Functions 5,000 cada 100 segundos 1,200 cada 60 segundos Solo para 1st gen Por proyecto (1st gen)
Por región (2nd gen)
Llamadas a la API (WRITE) Llamadas para implementar o borrar funciones a través de la API de Cloud Functions 80 cada 100 segundos 60 cada 60 segundos No1 Por proyecto (1st gen)
Por región (2nd gen)
Llamadas a la API (CALL) Llamadas a la API “de llamada” 16 cada 100 segundos N/A No2 Por proyecto

Escalabilidad

Las funciones de Cloud Functions invocadas por HTTP escalan rápidamente para procesar el tráfico entrante, mientras que las funciones en segundo plano escalan de manera más gradual. Varios factores determinan la capacidad de escalamiento de las funciones, incluidos los siguientes:

  • El tiempo que tarda la ejecución completa de una función (aquellas más breves suelen escalar verticalmente para procesar más solicitudes simultáneas)
  • El tiempo que tarda el inicio en frío de una función
  • Los límites de frecuencia descritos anteriormente
  • La tasa de errores de la función
  • Factores transitorios, como la carga regional y la capacidad del centro de datos
Las funciones en segundo plano tienen límites adicionales, como se explica a continuación. Esos límites no se aplican a las funciones de HTTP.

Cuotas adicionales para las funciones en segundo plano

Cuota Descripción Límite Se puede aumentar Permiso
Cantidad máxima de invocaciones simultáneas La cantidad máxima de invocaciones simultáneas de una sola función
Ejemplo: Si controlar cada evento tarda 100 segundos, la frecuencia de invocación se limitará a 30 por segundo en promedio.
3,000 No Por función
Frecuencia de invocación máxima La frecuencia máxima de los eventos que controla una sola función
Ejemplo: Si se tardan 100 ms en manejar un evento, la frecuencia de invocación se limitará a 1,000 por segundo, incluso si solo se manejan 100 solicitudes simultáneas en promedio.
1,000 por segundo No Por función
Tamaño máximo de datos de eventos simultáneos El tamaño total máximo de los eventos entrantes a las invocaciones simultáneas de una sola función
Ejemplo: Si los eventos tienen 1 MB de tamaño y tardan 10 segundos en procesarse, la frecuencia promedio será 1 evento por segundo, dado que no se procesará el 11º evento hasta que se termine de procesar uno de los 10 primeros.
10 MB No Por función
Capacidad de procesamiento máxima de los eventos entrantes La capacidad de procesamiento máxima de los eventos entrantes a una sola función
Ejemplo: Si los eventos tienen 1 MB de tamaño, la frecuencia de invocación máxima puede ser de 10 por segundo, incluso si las funciones finalizan en un plazo de 100 ms.
10 MB por segundo No Por función

Qué ocurre cuando alcanzas el límite de una cuota

Cuando una función consume por completo un recurso asignado, este deja de estar disponible hasta que aumente o se renueve la cuota. Así, es posible que no se ejecute tu función ni ninguna otra en el mismo proyecto hasta entonces. Una función muestra un código de error HTTP 500 cuando se supera la cuota de uno de los recursos y no se puede ejecutar la función.

Si quieres aumentar las cuotas por sobre los valores predeterminados que se indican aquí, ve a la página de cuotas de Cloud Functions y selecciona las cuotas que quieras modificar. Luego, haz clic en EDITAR CUOTAS, proporciona tu información de usuario si se te la solicita y, por último, ingresa el límite nuevo para cada cuota que hayas seleccionado.