Cette page présente les limites et quotas d'utilisation applicables lors de l'utilisation de Cloud Run.
Le nombre de ressources Cloud Run est limité. Les quotas pour Cloud Run incluent les limites de débit des API, ce qui affecte la fréquence à laquelle vous pouvez appeler l'API Admin Cloud Run.
Aucune limite directe ne concerne :
- la taille des images de conteneurs que vous pouvez déployer ;
- le nombre de requêtes simultanées diffusées par un service Cloud Run.
Limites de ressources pour Cloud Run
Ressource | Description | Limite | Augmentation possible | Champ d'application |
---|---|---|---|---|
Service | Nombre maximal de services | 1 000 | Non | Par projet et par région |
Tâche | Nombre maximal de jobs | 1000 | Non | Par projet et par région |
Exécution du service et du job | Nombre maximal d'exécutions de services et de job en cours | 1000 | Non | Par projet et par région |
Révision | Nombre maximal de révisions par service Une fois la limite atteinte, les révisions inactives sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non | Par service |
Révision et exécution du job | Nombre maximal de révisions diffusant le trafic et exécutant des exécutions de jobs | 4000 | Non | Par projet et par région |
Tag de révision | Nombre maximal de tags de révision | 2000 | Non | Par projet et par région |
Exécution du job | Limite de conservation pour les exécutions de jobs terminées. Lorsque le nombre d'exécutions d'un job terminées atteint cette limite, les exécutions sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non | par job |
Tâche d'exécution de jobs1 | Nombre maximal de tâches exécutées en parallèle | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui | par exécution de job |
Job d'exécution du job | Valeur maximale du délai avant expiration des tâches | 24 heures | Non | par exécution de job |
Job d'exécution du job | Nombre maximal d'opérations dans un job unique | 10 000 | Non | par exécution de job |
Job d'exécution du job | Nombre maximal de nouvelles tentatives d'exécution d'une opération dans un job | 10 | Non | par exécution de tâche |
Instance de conteneur1 | Nombre maximal d'instances de conteneur | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui | par révision |
Instance de conteneur1 | Nombre maximal d'instances de conteneur pour toutes les exécutions de jobs en cours | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui | Par projet et par région |
Instance de conteneur2 | Nombre maximal d'instances de conteneur utilisant la sortie VPC directe | 100 à 200, en fonction des configurations de région sélectionnées. | Oui | par révision et par région |
Instance de conteneur | Délai avant expiration du démarrage, en minutes | 4 | Non | Par instance de conteneur |
Memory | Taille maximale de la mémoire, en Gio | 32 | Non | Par instance de conteneur |
Processeur | Nombre maximal de processeurs virtuels | 8 | Non | Par instance de conteneur |
Disk | Système de fichiers maximal en mémoire, accessible en écriture, limité par la mémoire d'instance, en Gio | 32 | Non | Par instance de conteneur |
Variable d'environnement | Longueur maximale de la variable, en Ko | 32 | Non | Par variable |
Mappage de domaine | Nombre maximal de certificats SSL | 50 | Non | Par domaine de premier niveau et par semaine |
Mappage de domaine | Nombre maximal de certificats SSL en double | 5 | Non | Par domaine de premier niveau et par semaine |
Jeton d'accès | Nombre maximal de jetons d'accès uniques générés | 50 | Non | Par instance de conteneur et par seconde |
Jeton d'identité | Nombre maximal de jetons d'identité uniques générés | 50 | Non | Par instance de conteneur et par seconde |
1Ce quota régional est utilisé dans certains cas précis :
Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.
Pour contrôler le parallélisme maximal d'un job. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.
Pour contrôler le nombre total d'instances de conteneur pour l'exécution de jobs dans une région.
2Ce quota régional est utilisé dans certains cas précis :
Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.
Pour contrôler le parallélisme maximal d'un job à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.
Limites de mise en réseau pour Cloud Run
Limites de requêtes pour Cloud Run
Description | Limite | Notes |
---|---|---|
Nombre maximal de requêtes simultanées par instance | 1000 | |
Nombre maximal de flux simultanés par connexion client HTTP/2 | 100 | |
Délai maximal avant expiration par requête | 60 minutes | |
Taille maximale des requêtes HTTP/1 | 32 Mio si vous utilisez le serveur HTTP/1. Aucune limite si vous utilisez un serveur HTTP/2. | |
Taille maximale des réponses HTTP/1 | 32 Mio si vous n'utilisez pas Transfer-Encoding: chunked ni les mécanismes de streaming |
|
Connexions sortantes par seconde et par instance | 700 | |
Requêtes entrantes par seconde vers un port de conteneur HTTP/1 par instance | 800 | Ne s'applique pas aux ports de conteneur HTTP/2. |
Limites de bande passante pour Cloud Run
Les limites de bande passante suivantes s'appliquent aux instances Cloud Run :
Description | Limite | Remarques |
---|---|---|
Nombre maximal d'octets par instance pour la sortie via un VPC direct | 1 Gbit/s | Sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Nombre maximal d'octets par instance, en excluant la sortie via VPC direct | 75 mégaoctets par seconde (Mo/s) | Basé sur la somme des octets d'entrée et des octets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Débit total maximal de paquets par instance, à l'exclusion de la sortie via un VPC direct | 64 000 paquets par seconde | Basé sur la somme des paquets d'entrée et des paquets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Si l'une des deux limites est atteinte, la bande passante de l'instance Cloud Run sera limitée.
Limites de débit de l'API Admin Cloud Run
Les limites de débit suivantes s'appliquent à l'API Admin Cloud Run. Elles ne s'appliquent pas aux requêtes qui atteignent vos services Cloud Run déployés.
Quota | Description | Limite | Augmentation possible | Champ d'application |
---|---|---|---|---|
Requêtes de lecture de l'API Admin Cloud Run | Nombre de lectures de l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes de lecture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 3 000 pour 60 secondes | Oui | Par projet et par région |
Requêtes d'écriture dans l'API Admin Cloud Run | Nombre d'écritures dans l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes d'écriture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 180 pour 60 secondes | Oui | Par projet et par région |
Exécution de tâche | Nombre maximal d'exécutions d'une tâche pour 60 secondes, par région. | 180 pour 60 secondes | Oui | Par projet et par région |
Augmenter le quota
Pour demander une augmentation de quota à l'aide de la console Google Cloud, procédez comme suit :
Accédez à la page Quotas :
Les étapes restantes apparaîtront automatiquement dans la console Google Cloud.
Sur la page Quotas, recherchez le quota que vous souhaitez augmenter dans la colonne Quota.
Vous pouvez utiliser le champ de recherche Filtre pour rechercher votre quota.
Cochez la case située à gauche de votre quota.
Cliquez sur
. Le formulaire Modifications de quotas s'affiche. Modifier les quotas Dans le formulaire Modifications de quota, saisissez dans le champ Nouvelle limite le quota augmenté que vous souhaitez pour votre projet.
Renseignez tous les champs supplémentaires du formulaire, puis cliquez sur OK.
Cliquez sur ENVOYER LA REQUÊTE.
Bien que la procédure ci-dessus s'applique à la plupart des demandes d'augmentation de quota, vous pouvez rencontrer l'une des exceptions suivantes :
- S'il existe un plafond d'utilisation, celui-ci doit être supprimé avant de pouvoir augmenter le quota. Vous recevrez une divulgation et un accord. La déclaration indique que le plafond d'utilisation sera supprimé et que la limite sera immédiatement actualisée à la limite par défaut du quota. Votre demande d'augmentation de quota sera ensuite traitée normalement par Google Cloud.
- Dans certains cas, la console Google Cloud vous redirige vers un formulaire distinct pour demander une augmentation de la limite. Une fois le formulaire envoyé, Google Cloud accuse réception de votre demande par e-mail.
- D'autres quotas ne peuvent pas être mis à jour à l'aide de Google Cloud Console. Si vous constatez que vous ne pouvez pas modifier un quota dans la console, vous devez demander l'augmentation auprès de Cloud Customer Care. L'équipe chargée de la facturation ne gère pas les augmentations de limite de quota.
Nous vous recommandons de créer une demande d'augmentation de quota différente pour chaque classe de ressources. Par exemple, vous devez séparer les augmentations de quota par projet du réseau et les augmentations de quota hors-réseau Compute Engine. Si différentes classes de requêtes sont combinées, une requête d'augmentation peut retarder le lot si son approbation nécessite davantage de temps d'évaluation.
Si votre demande d'augmentation de quota nécessite une approbation, vous pouvez vous attendre à recevoir un e-mail de Google Cloud accusant réception de votre demande. Si vous avez besoin d'aide supplémentaire, vous pouvez répondre à cet e-mail. Cloud Customer Care traite votre demande, généralement sous deux à trois jours ouvrés, puis vous envoie un autre e-mail pour vous informer de l'approbation ou du refus de l'augmentation de quota. L'e-mail indique la date d'entrée en vigueur de l'augmentation, le cas échéant.
Pour en savoir plus sur le fonctionnement de l'augmentation de quota, consultez la page À propos des demandes d'augmentation de quota.