Cette page présente les limites et quotas d'utilisation applicables lors de l'utilisation de Cloud Run.
Le nombre de ressources Cloud Run est limité. Les quotas pour Cloud Run incluent les limites de débit des API, ce qui affecte la fréquence à laquelle vous pouvez appeler l'API Admin Cloud Run.
Aucune limite directe ne concerne :
- la taille des images de conteneurs que vous pouvez déployer ;
- le nombre de requêtes simultanées diffusées par un service Cloud Run.
Limites de ressources pour Cloud Run
Ressource | Description | Limite | Augmentation possible | Champ d'application |
---|---|---|---|---|
Service | Nombre maximal de services | 1 000 | Non | Par projet et par région |
Tâche | Nombre maximal de jobs | 1000 | Non | Par projet et par région |
Révision | Nombre maximal de révisions par service. Une fois la limite atteinte, les révisions inactives sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non | Par service |
Révision | Nombre maximal de révisions diffusant le trafic | 4000 | Non | Par projet et par région |
Tag de révision | Nombre maximal de tags de révision | 2000 | Non | Par projet et par région |
Exécution du job | Limite de conservation pour les exécutions de jobs terminées. Lorsque le nombre d'exécutions d'un job terminées atteint cette limite, les exécutions sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non | par job |
Tâche d'exécution de jobs1 | Nombre maximal de tâches exécutées en parallèle | 200 en cas d'utilisation d'un processeur et de 2 Gio de mémoire, dépend des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Yes | par exécution de job |
Job d'exécution du job | Valeur maximale du délai avant expiration des tâches | 1 heure | Non | par exécution de job |
Job d'exécution du job | Nombre maximal d'opérations dans un job unique | 10 000 | Non | par exécution de job |
Job d'exécution du job | Nombre maximal de nouvelles tentatives d'exécution d'une opération dans un job | 10 | Non | par exécution de tâche |
Instance de conteneur1 | Nombre maximal d'instances de conteneur | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Yes | par révision |
Instance de conteneur1 | Nombre maximal d'instances de conteneur pour toutes les exécutions de jobs en cours | 200 en cas d'utilisation d'un processeur et de 2 Gio de mémoire, dépend des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Yes | Par projet et par région |
Instance de conteneur | Délai avant expiration du démarrage, en minutes | 4 | Non | Par instance de conteneur |
Instance de conteneur | Connexions sortantes par seconde | 700 | Non | Par instance de conteneur |
Instance de conteneur | Requêtes entrantes par seconde vers un port de conteneur HTTP/1 (ne s'applique pas aux ports de conteneurs HTTP/2) | 800 | Non | Par instance de conteneur |
Memory | Taille maximale de la mémoire, en Gio | 32 | Non | Par instance de conteneur |
Processeur | Nombre maximal de processeurs virtuels | 8 | Non | Par instance de conteneur |
Disk | Système de fichiers maximal en mémoire, accessible en écriture, limité par la mémoire d'instance, en Gio | 32 | Non | Par instance de conteneur |
Variable d'environnement | Longueur maximale de la variable, en Ko | 32 | Non | Par variable |
Requête | Nombre maximal de requêtes simultanées | 1000 | Non | Par instance de conteneur |
Requête | Nombre maximal de flux simultanés | 100 | Non | Par connexion client HTTP/2 |
Requête | Délai maximal avant expiration, en minutes | 60 | Non | Par requête |
Demande | Taille maximale des requêtes HTTP/1, en Mio | 32 si vous utilisez le serveur HTTP/1. Aucune limite si vous utilisez un serveur HTTP/2. | Non | Par requête |
Réponse | Taille maximale des réponses HTTP/1, en Mio | 32 si vous n'utilisez pas Transfer-Encoding: chunked ni les mécanismes de streaming |
Non | Par réponse |
Mappage de domaine | Nombre maximal de certificats SSL | 50 | Non | Par domaine de premier niveau et par semaine |
Mappage de domaine | Nombre maximal de certificats SSL en double | 5 | Non | Par domaine de premier niveau et par semaine |
Jeton d'accès | Nombre maximal de jetons d'accès uniques générés | 50 | Non | Par instance de conteneur et par seconde |
Jeton d'identité | Nombre maximal de jetons d'identité uniques générés | 50 | Non | Par instance de conteneur et par seconde |
1Ce quota régional est utilisé dans certains cas précis :
Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.
Pour contrôler le parallélisme maximal d'un job. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.
Pour contrôler le nombre total d'instances de conteneur pour l'exécution de jobs dans une région.
REMARQUE : Lorsque ce quota est utilisé pour des jobs, il est d'abord divisé par 5.
Limites de débit de l'API Admin Cloud Run
Les limites de débit suivantes s'appliquent à l'API Admin Cloud Run. Elles ne s'appliquent pas aux requêtes qui atteignent vos services Cloud Run déployés.
Quota | Description | Limite | Augmentation possible | Champ d'application |
---|---|---|---|---|
Requêtes de lecture de l'API Admin Cloud Run | Nombre de lectures de l'API pour 60 secondes, par projet. Il ne s'agit pas du nombre de requêtes de lecture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 1 200 pour 60 secondes | Oui | Régional |
Requêtes d'écriture dans l'API Admin Cloud Run | Nombre d'écritures dans l'API pour 60 secondes, par projet. Il ne s'agit pas du nombre de requêtes d'écriture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 60 pour 60 secondes | Oui | Régional |
Exécution de tâche | Nombre maximal d'exécutions d'une tâche par minute et par région | 10 | Yes | Par projet et par région |
Augmenter le quota
Pour augmenter les quotas au-delà des valeurs par défaut répertoriées sur cette page, procédez comme suit :
Accédez à la page Quotas de Cloud Run.
Sélectionnez le ou les quotas que vous souhaitez modifier pour les régions applicables, puis cliquez sur MODIFIER LES QUOTAS.
Si vous y êtes invité, indiquez vos informations utilisateur et saisissez une nouvelle limite pour chaque quota sélectionné.
Votre demande sera transmise à l'équipe d'assistance pour s'assurer que Cloud Run peut gérer votre cas d'utilisation dans la région sélectionnée. Vous serez peut-être invité à fournir des informations sur votre configuration et les modèles de trafic attendus avant l'octroi de la requête. Le traitement des demandes d'augmentation importante peut prendre un certain temps.