Cuotas y límites

En este documento se indican las cuotas y los límites del sistema que se aplican a Media CDN.

  • Las cuotas tienen valores predeterminados, pero normalmente puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios recursos. Google Cloud

El sistema de cuotas de Cloud hace lo siguiente:

En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.

Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También hay límites del sistema en los recursos de Media CDN. Los límites del sistema no se pueden cambiar.

Límites

A continuación se muestran los límites que se aplican a Media CDN.

Configuración

Elemento Límites Notas
Número máximo de EdgeCacheService 20 por proyecto Ponte en contacto con tu Google Cloud equipo de ventas si necesitas aumentar este límite.
Número máximo de EdgeCacheOrigin 30 por proyecto Ponte en contacto con tu Google Cloud equipo de ventas si necesitas aumentar este límite.
Número máximo de EdgeCacheKeyset 10 por proyecto Ponte en contacto con tu Google Cloud equipo de Ventas si necesitas aumentar este límite.
Número máximo de RouteRules por EdgeCacheService 2000

Cada EdgeCacheService puede definir hasta 10 PathMatchers y cada PathMatcher puede definir hasta 200 RouteRules.

Este límite no se puede aumentar.

Número máximo de certificados SSL por servicio 5 Este límite no se puede aumentar. Consulta también la cuota por proyecto de certificados SSL.
Número máximo de claves públicas por EdgeCacheKeyset 3 Este límite no se puede aumentar. Se han diseñado varias claves en un conjunto de claves para permitir la rotación de claves: debes eliminar las claves antiguas y sin usar con el tiempo.
Número máximo de claves compartidas de validación por EdgeCacheKeyset 3 Este límite no se puede aumentar. Se han diseñado varias claves en un conjunto de claves para permitir la rotación de claves: debes eliminar las claves antiguas y sin usar con el tiempo.

Encabezados, solicitudes y respuestas HTTP

Elemento Límites Notas
Tamaño máximo del encabezado de solicitud Aprox. 11 KiB Este límite no se puede aumentar.

El tamaño combinado de la URL y del encabezado de la solicitud no puede superar los 15 KiB.

Las solicitudes se rechazan con una respuesta HTTP 431 para las conexiones HTTP/1.1.

Las conexiones HTTP/2 se cierran sin que se escriba un código de respuesta.

Estas solicitudes se registran con un statusDetails de headers_too_long si el registro está habilitado.

Tamaño máximo del cuerpo de la solicitud 16 KiB Las solicitudes con un cuerpo que supere este límite se rechazan con un código de estado HTTP 413 Content Too Large.
Tamaño máximo del encabezado de respuesta Aprox. 128 KiB Este límite no se puede aumentar.

Las respuestas de origen con encabezados que superen este límite darán como resultado el envío de un error HTTP 502 al cliente. Se registran con un statusDetails de backend_response_headers_too_long, si el registro está habilitado.

Tamaño máximo de objeto que se puede almacenar en caché 100 GiB Este límite no se puede aumentar.

Es el tamaño máximo de los objetos del origen que Media CDN puede almacenar en caché. Los objetos más grandes se tratan como no almacenables en caché.

Tamaño máximo de respuesta no almacenable en caché 500 MiB Este límite no se puede aumentar.

Es el número máximo de bytes del cuerpo de una respuesta que Media CDN proxyiza cuando un objeto no se puede almacenar en caché. Las respuestas que no se pueden almacenar en caché se truncan cuando alcanzan el límite.

Conversión a letras minúsculas en los encabezados Siempre, en Media CDN Media CDN sigue las convenciones de HTTP/2 en lo que respecta al uso de mayúsculas y minúsculas en los encabezados de solicitud y respuesta.

Independientemente del protocolo utilizado, todos los encabezados se convierten a minúsculas.

Por ejemplo, Host se convierte en host y Keep-Alive se convierte en keep-alive.

No se cambia el uso de mayúsculas y minúsculas de los valores de los encabezados.

Límites de frecuencia de solicitudes a la API

Si necesitas un límite de frecuencia mayor para las solicitudes a APIs, puedes consultar el uso actual y solicitar un aumento.

Elemento Límites
Invalidaciones 10 por minuto y EdgeCacheService
Todas las llamadas que no estén en el espacio de nombres networkservices 1200 llamadas por minuto y proyecto
Solo lectura: GetEdgeCache*, ListEdgeCache* 100 por minuto y proyecto
Lectura y escritura: todo lo que esté en el espacio de nombres networkservices y no esté marcado como de solo lectura 100 por minuto y proyecto

Tiempo de espera del cliente

Tiempo de espera Duración máxima Código de respuesta Descripción
Maximum request duration 5 minutos HTTP 408 (Request Timeout) Duración máxima de una sola solicitud-respuesta.
Header timeout 10 segundos HTTP 408 (Request Timeout) Tiempo que tiene el cliente para enviar el conjunto completo de encabezados de solicitud.

Tiempos de espera de origen

  • connectTimeout y maxAttemptsTimeout limitan el tiempo que tarda Media CDN en encontrar una respuesta útil.

    Ambos tiempos de espera incluyen el tiempo que tarda el origen en devolver las cabeceras y en determinar si se debe usar una conmutación por error o una redirección. connectTimeout se aplica de forma independiente a cada intento de origen, mientras que maxAttemptsTimeout incluye el tiempo necesario para conectarse en todos los intentos de origen, incluidas las conmutaciones por error y las redirecciones. Seguir una redirección cuenta como un intento adicional de conectarse al origen y se tiene en cuenta para el maxAttempts definido para el origen configurado.

    Cuando Media CDN recibe una respuesta que no es una redirección, como la de un origen de redirección o de failover, se aplican los valores readTimeout y responseTimeout. Los orígenes redirigidos usan los valores connectTimeout, readTimeout y responseTimeout configurados para el EdgeCacheOrigin que ha encontrado la redirección.

  • responseTimeout y readTimeout controlan cuánto tiempo puede tardar una respuesta transmitida. Una vez que Media CDN determina que va a usar una respuesta upstream, ni connectTimeout ni maxAttemptsTimeout importan. En este punto, se aplican readTimeout y responseTimeout.

Media CDN hace como máximo cuatro intentos de origen en todos los orígenes, independientemente del maxAttempts definido por cada EdgeCacheOrigin. Media CDN usa el valor maxAttemptsTimeout del primario EdgeCacheOrigin. Los valores de tiempo de espera por intento (connectTimeout, readTimeout y responseTimeout) se configuran para el EdgeCacheOrigin de cada intento.

En la siguiente tabla se describen los campos de tiempo de espera:

Campo Predeterminado Descripción
connectTimeout 5 segundos

El tiempo máximo que puede tardar Media CDN desde que se inicia la solicitud al origen hasta que Media CDN determina si la respuesta se puede usar. En la práctica, connectTimeout abarca el tiempo que transcurre desde que se crea la solicitud hasta que se obtienen los encabezados de respuesta que contienen el código de estado HTTP, pasando por las búsquedas de DNS, los handshakes TLS y el establecimiento de la conexión TCP/QUIC.

El tiempo de espera debe ser un valor entre 1 y 15 segundos.

maxAttemptsTimeout 15 segundos

Tiempo máximo de todos los intentos de conexión al origen, incluidos los orígenes de conmutación por error, antes de devolver un error al cliente. Se devuelve un error HTTP 504 si se alcanza el tiempo de espera antes de que se devuelva una respuesta.

El tiempo de espera debe ser un valor entre 1 y 30 segundos.

Este ajuste define la duración total de todos los intentos de conexión de origen, incluidos los orígenes de conmutación por error, para limitar el tiempo total que tienen que esperar los clientes para que empiece a transmitirse el contenido. Solo se usa el primer valor de maxAttemptsTimeout, donde first se define mediante el origen configurado para la ruta en cuestión.

readTimeout 15 segundos

Duración máxima que se espera entre lecturas de una única respuesta HTTP. El readTimeout está limitado por el responseTimeout. Todas las lecturas de la respuesta HTTP deben completarse antes de la fecha límite establecida por el responseTimeout. El tiempo de espera debe ser un valor entre 1 y 30 segundos. Si se alcanza este tiempo de espera antes de que se complete la respuesta, esta se trunca y se registra.

responseTimeout 30 segundos

Duración máxima que se permite para completar una respuesta.

El tiempo de espera debe ser un valor entre 1 segundo y 120 segundos.

La duración se mide desde el momento en que se reciben los primeros bytes del cuerpo. Si se alcanza este tiempo de espera antes de que se complete la respuesta, esta se trunca y se registra.

Administrar las cuotas

Media CDN aplica cuotas al uso de recursos por varios motivos. Por ejemplo, las cuotas protegen a la comunidad de usuarios Google Cloud a través de la prevención de los aumentos imprevistos en el uso. Las cuotas también ayudan a que los usuarios que exploran Google Cloud con el nivel gratuito permanezcan dentro de su prueba.

Todos los proyectos comienzan con las mismas cuotas, que puedes cambiar mediante la solicitud de cuotas adicionales. Algunas cuotas pueden aumentar de forma automática en función del uso que haces del producto.

Permisos

Para ver cuotas o solicitar aumentos de cuota, los principales de administración de identidades y accesos (IAM) necesitan una de las siguientes funciones:

Tarea Función requerida
Consultar cuotas para un proyecto Uno de los siguientes:
Modificar cuotas, solicitar cuota adicional Uno de los siguientes:
  • Propietario del proyecto (roles/owner)
  • Editor de proyecto (roles/editor)
  • Administrador de cuotas (roles/servicemanagement.quotaAdmin)
  • Una función personalizada con el permiso serviceusage.quotas.update

Comprueba tu cuota

Console

  1. En la Google Cloud consola, ve a la página Cuotas.

    Ir a Cuotas

  2. Para buscar la cuota que quieres actualizar, usa la tabla de filtros. Si no sabes el nombre de la cuota, usa los vínculos que aparecen en esta página en su lugar.

gcloud

Con la CLI de Google Cloud, ejecuta el siguiente comando para comprobar tus cuotas. Reemplaza PROJECT_ID con el ID de tu proyecto.

    gcloud compute project-info describe --project PROJECT_ID

Para verificar la cuota usada en una región, ejecuta el siguiente comando:

    gcloud compute regions describe example-region
    

Errores cuando excedes la cuota

Si excedes una cuota con un comando gcloud, gcloud muestra un mensaje de error quota exceeded y el código de salida 1.

Si excedes una cuota con una solicitud a la API, Google Cloud muestra el siguiente código de estado HTTP: 413 Request Entity Too Large.

Solicitar cuota adicional

Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud . Para obtener más información, consulta Solicita un ajuste de cuota.

Disponibilidad de recursos

Cada cuota representa la cantidad máxima de un tipo particular de recurso que puedes crear, siempre y cuando el recurso esté disponible. Es importante tener en cuenta que las cuotas no garantizan la disponibilidad del recurso. Incluso si tienes cuotas disponibles, no podrás crear un recurso nuevo si no está disponible.

Por ejemplo, podrías tener una cuota suficiente para crear una nueva dirección IP externa regional en una región determinada. Sin embargo, eso no es posible si no hay direcciones IP externas disponibles en esa región. La disponibilidad zonal de recursos también puede afectar tu capacidad para crear un nuevo recurso.

Las situaciones en las que los recursos no están disponibles en toda una región son poco frecuentes. Sin embargo, los recursos dentro de una zona pueden agotarse cada tanto, lo que generalmente no tiene ningún impacto en el Acuerdo de Nivel de Servicio (ANS) del tipo de recurso. Si deseas obtener más información, revisa el ANS que sea relevante para el recurso.