Se usó la API de Cloud Translation para traducir esta página.

Cuotas y límites de Cloud Run

En esta página, se proporcionan las cuotas de uso y los límites que se aplican por el uso de Cloud Run.

La cantidad de recursos de Cloud Run es limitada. Las cuotas para Cloud Run abarcan los límites de frecuencia de la API, que afectan la velocidad a la que puedes llamar a la API de Administrador de Cloud Run.

No hay límite directo para lo siguiente:

El tamaño de las imágenes de contenedor que puedes implementar.
La cantidad de solicitudes simultáneas que puede entregar un servicio de Cloud Run

Límites de recursos de Cloud Run

Para superar los límites que se pueden aumentar, solicita un aumento de cuota. Para superar los límites por proyecto que no se pueden aumentar, crea recursos nuevos en otro Google Cloud proyecto o región.

Recurso	Alcance	Descripción	Límite	Se puede aumentar
Servicio	por proyecto y región	Cantidad máxima de servicios	1,000	No
Trabajo	por proyecto y región	Cantidad máxima de trabajos	1000	No
Ejecución del trabajo	por proyecto y región	Cantidad máxima de ejecuciones de trabajos en ejecución	1000	No
Revisión	por servicio	Cantidad máxima de revisiones por servicio. Cuando se alcanza el límite, se borran automáticamente las revisiones que no se usan en orden cronológico	1,000	No
Revisión	por proyecto y región	Cantidad máxima de revisiones que entregan tráfico	4000	No
Etiqueta de revisión	por proyecto y región	Es la cantidad máxima de etiquetas de revisión. Cuando se supera el límite de etiquetas de revisión, Cloud Run ejecuta la limpieza de etiquetas en el servicio. En el caso del servicio para el que se crea una etiqueta nueva, las etiquetas que no tienen un porcentaje de tráfico especificado se borran automáticamente en orden cronológico.	2000	No
Ejecución del trabajo	por trabajo	Límite de retención para las ejecuciones de trabajos completadas. Cuando la cantidad de ejecuciones completadas de un trabajo alcanza este límite, las ejecuciones se borran de forma automática en orden histórico	1,000	No
Tarea de ejecución de trabajos¹	por ejecución de trabajos	Cantidad máxima de tareas que se ejecutan en paralelo	Depende de los parámetros de configuración de CPU y memoria. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema.	Sí
Tarea de ejecución de trabajos	por ejecución de trabajos	Valor máximo de tiempo de espera para las tareas	168 horas (7 días)²	No
Tarea de ejecución de trabajos	por ejecución de trabajos	Cantidad máxima de tareas en un solo trabajo	10,000	No
Tarea de ejecución de trabajos	por ejecución de trabajos	Cantidad máxima de reintentos de tareas en un trabajo	10	No
Variables de entorno	por trabajo o por servicio	Cantidad máxima de variables de entorno para cada contenedor	1000	No
Argumentos del comando	por trabajo o por servicio	Cantidad máxima de argumentos de comando para cada contenedor	1000	No
Instancia de contenedor³	por revisión y región	Cantidad máxima de instancias de contenedor con la salida de a VPC directa	De 100 a 200, según las opciones de configuración de región seleccionadas	Sí
Instancias de contenedor	por instancia de contenedor	Tiempo de espera de inicio, en minutos	4	No
Memoria	por instancia de contenedor	Tamaño máximo de la memoria, en GiB	32	No
CPU	por instancia de contenedor	Cantidad máxima de CPU virtuales	8	No
CPU¹	por proyecto y región	CPU total máxima, en CPU virtuales, asignada en todas las instancias durante un período de 1 minuto.	Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente.	Sí
Memoria¹	por proyecto y región	Memoria total máxima, en bytes, asignada en todas las instancias durante un período de 1 minuto.	Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema.	Sí
Instancia de GPU sin garantía de redundancia zonal¹, ⁴	por proyecto y por región	Cantidad máxima de instancias de contenedor con GPU	0⁴	Sí
Instancia de GPU con garantía de redundancia zonal¹, ⁴	por proyecto y por región	Cantidad máxima de instancias de contenedor con GPU	0⁴	Sí
Disco	por instancia de contenedor	Máximo de sistemas de archivos en la memoria que admiten escritura, limitado por la memoria de la instancia, en GiB	32	No
Variable de entorno	por variable	Longitud variable máxima, en Kb	32	No
Asignación de dominios	por dominio principal y por semana	Cantidad máxima de certificados SSL	50	No
Asignación de dominios	por dominio principal y por semana	Cantidad máxima de certificados SSL duplicados	5	No
Token de acceso	por instancia de contenedor por segundo	Cantidad máxima de tokens de acceso únicos generados	50	No
Token de identidad	por instancia de contenedor por segundo	Cantidad máxima de tokens de identidad únicos generados	50	No
Archivos abiertos	por instancia de contenedor	Es la cantidad máxima de archivos que se pueden abrir al mismo tiempo. Corresponde a `/proc/sys/fs/file-max`.	25000	No

¹Estas cuotas regionales se usan en algunos casos en los que cada una controla lo siguiente:

Es el valor máximo que se puede elegir para el atributo instancia máxima de una revisión. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.

Es el paralelismo máximo de un trabajo. Una vez que se otorga en una región determinada, todos los trabajos en esa región pueden alcanzar el límite otorgado.

Es el total de instancias de contenedor para ejecutar ejecuciones de trabajos en una región.

²La compatibilidad con tiempos de espera superiores a 24 horas está disponible en la versión preliminar.

³Esta cuota regional se usa en algunos casos:

Controla el valor máximo que se puede elegir para el atributo instancia máxima de una revisión a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.

Controla e paralelismo máximo de un trabajo a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todos los trabajos en esa región pueden alcanzar el límite otorgado.

⁴ Los proyectos nuevos que creen un servicio con GPUs L4 recibirán automáticamente 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. También puedes solicitar la cuota de NvidiaL4GpuAllocPerProjectRegion o NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Si el uso máximo de la GPU no se acerca a tu cuota, es posible que Google la disminuya.

Límites de Herramientas de redes para Cloud Run

Límites de solicitudes de Cloud Run

Descripción	Límite	Notas
Cantidad máxima de solicitudes simultáneas por instancia	1000
Cantidad máxima de transmisiones simultáneas por conexión de cliente HTTP/2	100
Tiempo máximo antes de que se agote el tiempo de espera por solicitud	60 minutos
Tamaño máximo de solicitudes HTTP/1	32 si se usa el servidor HTTP/1. No hay límite si se usa el servidor HTTP/2.
Tamaño máximo de respuestas HTTP/1	32 MiB si no se usa `Transfer-Encoding: chunked` o mecanismos de transmisión
Cantidad máxima de conexiones abiertas por instancia y por tipo de salida (Internet o VPC)	50,000	No se aplica al tráfico de salida de VPC directa.
Conexiones salientes por segundo por instancia	700	No se aplica al tráfico de salida directa de VPC que se envía a la red de VPC, que no está limitado.
Resoluciones de DNS salientes por segundo por instancia	1000
Solicitudes entrantes por segundo a un puerto de contenedor HTTP/1 por instancia	800	No se aplica a los puertos de contenedor HTTP/2.

Límites de ancho de banda para Cloud Run

Los siguientes límites de ancho de banda se aplican a las instancias de Cloud Run:

Descripción	Límite	Notas
Cantidad máxima de bits por instancia para la salida a través de VPC directa	1 Gbps	Salida en la salida de VPC directa a los destinos en la red de VPC.
Cantidad máxima de bits por instancia, sin incluir la salida a través de VPC directa	600 Mbps	Se basa en la suma de los bits de entrada y los de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC.
Frecuencia máxima total de paquetes por instancia, sin incluir la salida a través de VPC directa	64,000 paquetes por segundo	Se basa en la suma de los paquetes de entrada y los de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC.

Si se alcanza alguno de los dos límites, la instancia de Cloud Run tendrá un ancho de banda limitado.

Límites de frecuencia de la API de Administrador de Cloud Run

Se aplican los siguientes límites de frecuencia a la API de Administrador de Cloud Run. No se aplican a las solicitudes que alcanzan los servicios implementados de Cloud Run.

Cuota	Descripción	Límite	Se puede aumentar	Alcance
Solicitudes de lectura a la API de Administrador de Cloud Run	La cantidad de lecturas de la API cada 60 segundos, por región. Esta es diferente de la cantidad de solicitudes de lectura de los servicios de Cloud Run, que es ilimitada.	3,000 cada 60 segundos	Sí	por proyecto y región
Solicitudes de escritura a la API de Administrador de Cloud Run	La cantidad de operaciones de escritura de la API cada 60 segundos, por región. Esta es diferente a la cantidad de solicitudes de escritura a los servicios de Cloud Run, que es ilimitada.	180 cada 60 segundos	Sí	por proyecto y región
Ejecución de trabajo	Cantidad máxima de veces que se puede ejecutar un trabajo cada 60 segundos por región.	180 cada 60 segundos	Sí	por proyecto y región

Cómo aumentar la cuota

Las solicitudes de ajuste de cuotas de Cloud están sujetas a revisión. Si tu solicitud de ajuste de cuota requiere una revisión, recibirás un correo electrónico en el que se confirmará la recepción de la solicitud. Si necesitas asistencia adicional, responde el correo electrónico. Después de revisar tu solicitud, recibirás una notificación por correo electrónico en la que se indicará si se aprobó.

Console

Para ajustar el valor de una cuota, sigue estos pasos:

En la consola de Google Cloud , ve a la página IAM y administración > Cuotas y límites del sistema:
Ir a Cuotas y límites del sistema
Busca el valor de la cuota que deseas actualizar en la columna Cuota y selecciona la casilla de verificación junto a la cuota que deseas actualizar.

Si es necesario, usa el cuadro de búsqueda Filtrar para buscar la cuota.
Haz clic en Editar y aparecerá el diálogo Cambios en la cuota.
Ingresa el valor de cuota que deseas en el campo Valor nuevo. Algunos valores de cuota tienen una unidad de medida. Si este es el caso, selecciona la unidad que quieras en la lista adyacente. Haz clic en Listo.

Opcional: Si ves una casilla de verificación con el texto I understand that this request will remove any overrides, significa que, si ajustas el valor de la cuota a un número igual o superior al predeterminado, se quitará la anulación de cuota anterior. Si es lo que quieres, selecciona la casilla de verificación y continúa.
Para aumentar el valor de tu cuota más allá del número indicado en el cuadro de diálogo, selecciona Solicitar una cuota mayor.
1. En el formulario Cambios de cuota, ingresa el valor de cuota actualizado que deseas en el campo Valor nuevo. Si aparece el campo Descripción de la solicitud, ingresa una descripción. Haz clic en Listo.
2. Si aparece el botón Siguiente, haz clic en Siguiente y completa los detalles de tu contacto en la pantalla que aparece a continuación.
Haz clic en Enviar solicitud.

Si notas que no puedes solicitar un ajuste desde la consola, solicita el aumento desde Atención al cliente de Cloud.

Para obtener más información sobre cómo funciona el proceso de aumento de cuota, consulta Acerca de los ajustes de cuota.

Solicitudes por lotes para valores de cuota más altos

Para enviar solicitudes por lotes de cuotas más altas, selecciona la casilla de verificación junto a cada cuota que quieras incluir. Sin embargo, las solicitudes por lotes pueden aumentar el tiempo que Google Cloud tarda en revisar tu solicitud.

Para reducir el tiempo de revisión, agrupa las solicitudes de ajuste de cuota por producto y área. Por ejemplo, si quieres solicitar ajustes en las cuotas de redes y de VM de Compute Engine, crea una solicitud para las cuotas de redes y otra para las cuotas de VMs de Compute Engine.

Cuotas y límites de Cloud Run Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.