Cuotas y límites de Cloud Run

En esta página, se proporcionan las cuotas de uso y los límites que se aplican por el uso de Cloud Run.

La cantidad de recursos de Cloud Run es limitada. Las cuotas para Cloud Run abarcan los límites de frecuencia de la API, que afectan la velocidad a la que puedes llamar a la API de Administrador de Cloud Run.

No hay límite directo para lo siguiente:

  • El tamaño de las imágenes de contenedor que puedes implementar.
  • La cantidad de solicitudes simultáneas que puede entregar un servicio de Cloud Run

Límites de recursos de Cloud Run

Recurso Descripción Límite Se puede aumentar Alcance
Servicio Cantidad máxima de servicios 1,000 No. por proyecto y región
Job Cantidad máxima de trabajos 1000 No. por proyecto y región
Ejecución del trabajo y del servicio Cantidad máxima de servicios y ejecuciones del trabajo en curso 1000 No. por proyecto y región
Revisión Cantidad máxima de revisiones por servicio. Cuando se alcanza el límite, se borran automáticamente las revisiones que no se usan en orden cronológico 1,000 No por servicio
Revisión y ejecución del trabajo Cantidad máxima de revisiones que entregan tráfico y ejecutan ejecuciones de trabajos 4000 No. por proyecto y región
Etiqueta de revisión Cantidad máxima de etiquetas de revisión 2000 No. por proyecto y región
Ejecución del trabajo Límite de retención para las ejecuciones de trabajos completadas. Cuando la cantidad de ejecuciones completadas de un trabajo alcanza este límite, las ejecuciones se borran de forma automática en orden histórico 1,000 No. por trabajo
Tarea de ejecución de trabajos1 Cantidad máxima de tareas que se ejecutan en paralelo Depende de la región y las opciones de configuración de CPU y memoria seleccionadas. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. por ejecución de trabajos
Tarea de ejecución de trabajos Valor máximo de tiempo de espera para las tareas Las 24 horas No. por ejecución de trabajos
Tarea de ejecución de trabajos Cantidad máxima de tareas en un solo trabajo 10,000 No. por ejecución de trabajos
Tarea de ejecución de trabajos Cantidad máxima de reintentos de tareas en un trabajo 10 No. por ejecución de trabajos
Instancias de contenedor1 Cantidad máxima de instancias de contenedor Depende de la región seleccionada y las configuraciones de CPU y memoria. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. por revisión
Instancias de contenedor1 Cantidad máxima de instancias de contenedor de todas las ejecuciones de trabajos en ejecución Depende de la región y las opciones de configuración de CPU y memoria seleccionadas. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. por proyecto y región
Instancias de contenedor2 Cantidad máxima de instancias de contenedor con la salida de a VPC directa De 100 a 200, según las opciones de configuración de región seleccionadas por revisión y región
Instancias de contenedor Tiempo de espera de inicio, en minutos 4 No por instancia de contenedor
Memoria Tamaño máximo de la memoria, en GiB 32 No. por instancia de contenedor
CPU Cantidad máxima de CPU virtuales 8 No. por instancia de contenedor
Disco Máximo de sistemas de archivos en la memoria que admiten escritura, limitado por la memoria de la instancia, en GiB 32 No. por instancia de contenedor
Variable de entorno Longitud variable máxima, en Kb 32 No por variable
Asignación de dominios Cantidad máxima de certificados SSL 50 No por dominio principal y por semana
Asignación de dominios Cantidad máxima de certificados SSL duplicados 5 No por dominio principal y por semana
Token de acceso Cantidad máxima de tokens de acceso únicos generados 50 No por instancia de contenedor por segundo
Token de identidad Cantidad máxima de tokens de identidad únicos generados 50 No por instancia de contenedor por segundo

1Esta cuota regional se usa en algunos casos:

  1. Controla el valor máximo que se puede elegir para el atributo instancia máxima de una revisión. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.

  2. Controla el parallelism máximo de un trabajo. Una vez que se otorga en una región determinada, todos los trabajos de esa región pueden alcanzar el límite otorgado.

  3. Controla el total de instancias de contenedor para ejecutar ejecuciones de trabajos en una región.

2Esta cuota regional se usa en algunos casos:

  1. Controla el valor máximo que se puede elegir para el atributo instancia máxima de una revisión a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.

  2. Controla el paralelismo máximo de un trabajo a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todos los trabajos en esa región pueden alcanzar el límite otorgado.

Límites de Herramientas de redes para Cloud Run

Límites de solicitudes de Cloud Run

Descripción Límite Notas
Cantidad máxima de solicitudes simultáneas por instancia 1000
Cantidad máxima de transmisiones simultáneas por conexión de cliente HTTP/2 100
Tiempo máximo antes de que se agote el tiempo de espera por solicitud 60 minutos
Tamaño máximo de solicitudes HTTP/1 32 si se usa el servidor HTTP/1. No hay límite si se usa el servidor HTTP/2.
Tamaño máximo de respuestas HTTP/1 32 MiB si no se usa Transfer-Encoding: chunked o mecanismos de transmisión
Conexiones salientes por segundo por instancia 700
Solicitudes entrantes por segundo a un puerto de contenedor HTTP/1 por instancia 800 No se aplica a los puertos de contenedor HTTP/2.

Límites de ancho de banda para Cloud Run

Los siguientes límites de ancho de banda se aplican a las instancias de Cloud Run:

Descripción Límite Notas
Cantidad máxima de bytes por instancia 75 megabytes por segundo (Mbps) Este límite se basa en la suma de los bytes de entrada y los de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC.
Frecuencia de paquetes total máxima por instancia 64,000 paquetes por segundo Este límite se basa en la suma de paquetes de entrada y paquetes de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC.

Si se alcanza alguno de los dos límites, la instancia de Cloud Run tendrá un ancho de banda limitado.

Límites de frecuencia de la API de Administrador de Cloud Run

Se aplican los siguientes límites de frecuencia a la API de Administrador de Cloud Run. No se aplican a las solicitudes que alcanzan los servicios implementados de Cloud Run.

Cuota Descripción Límite Se puede aumentar Alcance
Solicitudes de lectura a la API de Administrador de Cloud Run La cantidad de lecturas de la API cada 60 segundos, por región. Esta es diferente de la cantidad de solicitudes de lectura de los servicios de Cloud Run, que es ilimitada. 3,000 cada 60 segundos por proyecto y región
Solicitudes de escritura a la API de Administrador de Cloud Run La cantidad de operaciones de escritura de la API cada 60 segundos, por región. Esta es diferente a la cantidad de solicitudes de escritura a los servicios de Cloud Run, que es ilimitada. 180 cada 60 segundos por proyecto y región
Ejecución de trabajo Cantidad máxima de veces que se puede ejecutar un trabajo cada 60 segundos por región. 180 cada 60 segundos por proyecto y región

Cómo aumentar la cuota

Para solicitar un valor de cuota más alto con la consola de Google Cloud, sigue estos pasos:

  1. Ir a la página de cuotas

    Ir a Cuotas

    Los pasos restantes aparecerán automáticamente en la consola de Google Cloud.

  2. En la página Cuotas, busca la cuota que deseas aumentar en la columna Cuota.

    Puedes usar el cuadro de búsqueda Filtrar para buscar tu cuota.

  3. Selecciona la casilla de verificación a la izquierda de tu cuota.

  4. Haz clic en EDITAR CUOTAS. Aparecerá el formulario Cambios en la cuota.

  5. En el formulario Cambios en la cuota, ingresa la cuota aumentada que deseas para tu proyecto en el campo Nuevo límite.

  6. Completa los campos adicionales del formulario y, luego, haz clic en LISTO.

  7. Haz clic en ENVIAR SOLICITUD.

Si bien el procedimiento anterior se aplica a la mayoría de las solicitudes de aumento de cuota, puedes encontrar una de las siguientes excepciones:

  • En el caso de que haya un límite de uso, se debe quitar antes de que se pueda aumentar la cuota. Se te proporcionará una divulgación y un acuerdo. La divulgación indica que se borrará el límite de uso y se actualizará de inmediato al límite predeterminado. Luego, Google Cloud procesará con normalidad la solicitud de aumento de cuota.
  • A veces, la consola de Google Cloud te redirecciona a un formulario independiente para solicitar un aumento de límite. Después de enviar el formulario, Google Cloud confirma tu solicitud por correo electrónico.
  • Algunas cuotas no se pueden actualizar con la consola de Google Cloud. Si notas que no puedes cambiar una cuota desde la consola, solicita un aumento desde Atención al cliente de Cloud. El equipo de Facturación no maneja los aumentos de límite de cuota.

Google recomienda que crees una solicitud de aumento de cuota diferente para cada clase de recursos. Por ejemplo, debes separar los aumentos de cuota de red por proyecto de los aumentos de cuota de Compute Engine que no son de red. Si se combinan diferentes clases de solicitudes, una solicitud de aumento puede retrasar el lote si su aprobación requiere más tiempo de evaluación.

Si tu solicitud de aumento de cuota requiere aprobación, puedes recibir un correo electrónico de Google Cloud en el que se confirme la recepción de tu solicitud. Si necesitas ayuda, puedes responder a ese mensaje. El equipo de Atención al cliente de Cloud generalmente procesa las solicitudes en un plazo de 2 a 3 días hábiles. Luego, te envía un segundo correo electrónico para notificarte si el aumento de la cuota se aprobó o rechazó. En el correo electrónico, se proporciona la fecha de entrada en vigencia del aumento, si corresponde.

Para obtener más información sobre cómo funciona el proceso de aumento de cuota, consulta Acerca de las solicitudes de aumento de cuota.