Définir un nombre maximal d'instances de conteneur

Cette page explique comment définir le nombre maximal d'instances de conteneur pouvant être utilisées pour votre service Cloud Run. La spécification du nombre maximal d'instances dans Cloud Run vous permet de limiter le scaling de votre service en réponse aux requêtes entrantes, bien que ce paramètre maximal puisse être légèrement dépassé pendant une courte période en raison de circonstances telles que des pics de trafic. Utilisez ce paramètre pour contrôler vos coûts ou limiter le nombre de connexions à un service externe, tel qu'une base de données.

Si vous souhaitez spécifier un nombre maximal d'instances supérieur à 1 000 pour Cloud Run, sachez que vous devez d'abord demander une augmentation du quota.

Si vous voulez savoir comment Cloud Run effectue l'autoscaling des instances de conteneur, consultez la page À propos de l'autoscaling des instances de conteneur.

Définir et modifier le nombre maximal d'instances

Toute modification de configuration entraîne la création d'une révision. Les révisions ultérieures obtiennent aussi automatiquement le même paramètre de configuration, à moins que vous ne le mettiez explicitement à jour.

Par défaut, le nombre d'instances de conteneur peut aller jusqu'à 1 000 instances. Vous pouvez modifier cette valeur par défaut à l'aide de Cloud Console, de la ligne de commande gcloud ou d'un fichier YAML lorsque vous créez un service ou déployez une nouvelle révision :

Console

  1. Accédez à Cloud Run

  2. Cliquez sur Créer un service si vous configurez un nouveau service sur lequel effectuer un déploiement. Si vous configurez un service existant, cliquez sur celui-ci puis sur Modifier et déployer la nouvelle révision.

  3. Si vous configurez un nouveau service, renseignez la page de paramètres initiale du service, puis cliquez sur Suivant > Paramètres avancés pour accéder à la page de configuration du service.

  4. Cliquez sur l'onglet Conteneur.

    image

  5. Dans le champ Maximum number of instances (Nombre maximal d'instances), spécifiez le nombre maximal d'instances de conteneur souhaité, en utilisant une valeur entière comprise entre 1 et 1000 (ou plus si vous avez demandé une augmentation de quota).

  6. Cliquez sur Créer ou Déployer.

Ligne de commande

Vous pouvez mettre à jour le nombre maximal d'instances de conteneur d'un service donné à l'aide de la commande suivante :

gcloud run services update SERVICE --max-instances MAX-VALUE

Remplacez

  • SERVICE par le nom de votre service ;
  • MAX-VALUE par le nombre maximal d'instances de conteneur souhaité, en utilisant une valeur entière comprise entre 1 et 1000 (ou plus si vous avez demandé une augmentation de quota). Spécifiez default pour effacer tout paramétrage du nombre maximal d'instances.

Vous pouvez également définir le nombre maximal d'instances de conteneur lors du déploiement à l'aide de la commande suivante :

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Remplacez

  • IMAGE_URL par une référence à l'image du conteneur, par exemple us-docker.pkg.dev/cloudrun/container/hello:latest ;
  • MAX-VALUE par le nombre maximal d'instances de conteneur souhaité, en utilisant une valeur entière comprise entre 1 et 1000 (ou plus si vous avez demandé une augmentation de quota). Spécifiez default pour effacer tout paramétrage du nombre maximal d'instances.

YAML

Vous pouvez télécharger et afficher la configuration de service existante à l'aide de la commande gcloud run services describe --format export, qui renvoie les résultats nettoyés au format YAML. Vous pouvez ensuite modifier les champs décrits ci-dessous et importer le fichier YAML modifié à l'aide de la commande gcloud run services replace. Veillez à ne modifier que les champs indiqués.

  1. Pour afficher et télécharger la configuration, exécutez la commande suivante :

    gcloud run services describe SERVICE --format export > service.yaml
  2. Mettez à jour l'attribut autoscaling.knative.dev/maxScale: :

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Remplacez

    • MAX-INSTANCE par le nombre maximal souhaité.
  3. Remplacez la configuration du service en utilisant la commande suivante :

    gcloud run services replace service.yaml

Afficher les paramètres du nombre maximal d'instances

Pour afficher les paramètres du nombre maximal d'instances actuel pour votre service, procédez comme suit :

Console

  1. Accédez à Cloud Run

  2. Cliquez sur le service qui vous intéresse pour ouvrir la page Informations sur le service.

  3. Cliquez sur l'onglet Révisions.

  4. Dans le panneau de détails sur la droite, le paramètre "Nombre maximal d'instances" est répertorié sous l'onglet Conteneur.

Ligne de commande

  1. Exécutez la commande suivante :

    gcloud run services describe SERVICE
  2. Recherchez le paramètre du nombre maximal d'instances dans la configuration renvoyée.