Définir le nombre maximal d'instances (services)

Cette page explique comment définir le nombre maximal d'instances pouvant être utilisées pour votre service Cloud Run.

La spécification du nombre maximal d'instances dans Cloud Run vous permet de limiter le scaling de votre service en réponse aux requêtes entrantes, bien que ce paramètre maximal puisse être dépassé pendant une courte période en raison de circonstances telles que des pics de trafic.

Vous pouvez utiliser ce paramètre pour contrôler vos coûts ou limiter le nombre de connexions à un service de backend, tel qu'une base de données.

Pour en savoir plus sur le nombre maximal d'instances pouvant s'appliquer à votre service, consultez la section Limites maximales d'instances.

Si vous voulez savoir comment Cloud Run effectue l'autoscaling des instances de conteneur, consultez la page À propos de l'autoscaling des instances de conteneur.

Rôles requis

Pour obtenir les autorisations nécessaires pour configurer et déployer des services Cloud Run, demandez à votre administrateur de vous accorder les rôles IAM suivants :

Pour obtenir la liste des rôles et des autorisations IAM associés à Cloud Run, consultez les sections Rôles IAM Cloud Run et Autorisations IAM Cloud Run. Si votre service Cloud Run communique avec les API Google Cloud, telles que les bibliothèques clientes Cloud, consultez le guide de configuration de l'identité du service. Pour en savoir plus sur l'attribution de rôles, consultez les sections Autorisations de déploiement et Gérer les accès.

Définir et mettre à jour le nombre maximal d'instances

Tout changement de configuration entraîne la création d'une révision. Les révisions ultérieures obtiennent aussi automatiquement le même paramètre de configuration, à moins que vous ne le mettiez explicitement à jour.

Par défaut, les services Cloud Run sont configurés pour effectuer un scaling maximal à 100 instances.

Vous pouvez modifier le paramètre du nombre maximal d'instances à l'aide de la console Google Cloud, de Google Cloud CLI ou d'un fichier YAML lorsque vous créez un service ou déployez une nouvelle révision.

Console

  1. Dans la console Google Cloud, accédez à Cloud Run :

    Accédez à Cloud Run

  2. Cliquez sur Déployer un conteneur et sélectionnez Service pour configurer un nouveau service. Si vous configurez un service existant, cliquez sur celui-ci puis sur Modifier et déployer la nouvelle révision.

  3. Si vous configurez un nouveau service, remplissez la page initiale des paramètres du service, puis cliquez sur Conteneur(s), volumes, mise en réseau et sécurité pour développer la page de configuration du service.

  4. Cliquez sur l'onglet Conteneur.

    image

    • Dans le champ intitulé Maximum number of instances (Nombre maximal d'instances), spécifiez le nombre maximal d'instances souhaité, en utilisant une valeur entière comprise entre 1 et la limite maximale.
  5. Cliquez sur Créer ou Déployer.

gcloud

Vous pouvez mettre à jour le nombre maximal d'instances d'un service donné à l'aide de la commande suivante :

gcloud run services update SERVICE --max-instances MAX-VALUE

Remplacer

  • SERVICE par le nom de votre service ;
  • MAX-VALUE par le nombre maximal d'instances de conteneur souhaité, en utilisant une valeur entière comprise entre 1 et la limite maximale. Spécifiez default pour effacer tout paramétrage du nombre maximal d'instances et restaurer la valeur par défaut de 100 instances.

Vous pouvez également définir le nombre maximal d'instances lors du déploiement à l'aide de la commande suivante :

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Remplacer

  • IMAGE_URL par une référence à l'image de conteneur, par exemple us-docker.pkg.dev/cloudrun/container/hello:latest. Si vous utilisez Artifact Registry, le dépôt REPO_NAME doit déjà être créé. L'URL se présente sous la forme suivante : LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
  • MAX-VALUE par le nombre maximal d'instances de conteneur souhaité.

YAML

  1. Si vous créez un service, ignorez cette étape. Si vous mettez à jour un service existant, téléchargez sa configuration YAML :

    gcloud run services describe SERVICE --format export > service.yaml
  2. Mettez à jour l'attribut autoscaling.knative.dev/maxScale: :

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Remplacer

    • SERVICE par le nom de votre service Cloud Run
    • MAX-INSTANCE par le nombre maximal requis.
    • REVISION par un nouveau nom de révision ou supprimez-le (le cas échéant). Si vous indiquez un nouveau nom de révision, il doit répondre aux critères suivants :
      • Commencer par SERVICE-
      • Ne contenir que des lettres minuscules, des chiffres et -
      • Ne pas se terminer par -
      • Ne pas dépasser 63 caractères
  3. Créez ou mettez à jour le service à l'aide de la commande suivante :

    gcloud run services replace service.yaml

Terraform

Pour savoir comment appliquer ou supprimer une configuration Terraform, consultez Commandes Terraform de base.

La ressource google_cloud_run_v2_service suivante spécifie un nombre maximal d'instances de 10 sous template.scaling. Remplacez 10 par le nombre maximal d'instances requis.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Afficher les paramètres du nombre maximal d'instances

Pour afficher les paramètres actuels du nombre maximal d'instances de votre service Cloud Run, procédez comme suit :

Console

  1. Dans la console Google Cloud, accédez à Cloud Run :

    Accédez à Cloud Run

  2. Cliquez sur le service qui vous intéresse pour ouvrir la page Informations sur le service.

  3. Cliquez sur l'onglet Révisions.

  4. Dans le panneau de détails sur la droite, le paramètre "Nombre maximal d'instances" est répertorié sous l'onglet Conteneur.

gcloud

  1. Exécutez la commande suivante :

    gcloud run services describe SERVICE
  2. Recherchez le paramètre du nombre maximal d'instances dans la configuration renvoyée.