Définir une simultanéité maximale

Pour comprendre le réglage de la simultanéité maximale, lisez le document sur le concept de simultanéité.

Tout changement de configuration entraîne la création d'une révision. Les révisions ultérieures obtiennent aussi automatiquement le même paramètre de configuration, à moins que vous ne le mettiez explicitement à jour.

Vous pouvez définir une simultanéité maximale à l'aide de Cloud Console, de la ligne de commande gcloud ou d'un fichier .yaml lorsque vous créez un service ou lorsque vous déployez une nouvelle révision :

Console

  1. Accédez à Cloud Run

  2. Cliquez sur Créer un service si vous configurez un nouveau service sur lequel effectuer un déploiement. Si vous configurez un service existant, cliquez sur celui-ci puis sur Modifier et déployer la nouvelle révision.

  3. Si vous configurez un nouveau service, renseignez la page de paramètres initiale du service, puis cliquez sur Suivant > Paramètres avancés pour accéder à la page de configuration du service.

  4. Cliquez sur l'onglet Conteneur.

    image

  5. Définissez la valeur de simultanéité maximale souhaitée dans la zone de texte Maximum requests per container (Nombre maximal de requêtes par conteneur).

  6. Cliquez sur Créer ou Déployer.

Ligne de commande

Pour définir la simultanéité maximale, exécutez la commande suivante :

gcloud run services update SERVICE --concurrency CONCURRENCY

Remplacer

  • SERVICE par le nom de votre service ;
  • CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur. Par exemple, la ligne de commande suivante définit un maximum de 40 requêtes simultanées :

    gcloud run services update SERVICE --concurrency 40

La modification de la simultanéité maximale d'un service donné entraîne la réutilisation de ce paramètre pour toute nouvelle révision.

Pour rétablir la valeur de simultanéité maximale par défaut (80), utilisez la commande ci-dessous :

gcloud run services update SERVICE --concurrency default

Remplacez SERVICE par le nom du service que vous configurez.

YAML

Vous pouvez télécharger et afficher la configuration de service existante à l'aide de la commande gcloud run services describe --format export, qui renvoie les résultats nettoyés au format YAML. Vous pouvez ensuite modifier les champs décrits ci-dessous et importer le fichier YAML modifié à l'aide de la commande gcloud run services replace. Veillez à ne modifier que les champs indiqués.

  1. Pour afficher et télécharger la configuration, exécutez la commande suivante :

    gcloud run services describe SERVICE --format export > service.yaml
  2. Mettez à jour l'attribut containerConcurrency :

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Remplacez

    • SERVICE par le nom de votre service Cloud Run ;
    • IMAGE par l'URL de votre image de conteneur
    • CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur.
  3. Remplacez la configuration du service en utilisant la commande suivante :

    gcloud run services replace service.yaml

Afficher les paramètres de simultanéité

Pour afficher les paramètres de simultanéité actuels de votre service, procédez comme suit :

Console

  1. Accédez à Cloud Run

  2. Cliquez sur le service qui vous intéresse pour ouvrir la page Informations sur le service.

  3. Cliquez sur l'onglet Révisions.

  4. Dans le panneau de détails sur la droite, le paramètre de simultanéité est répertorié dans l'onglet Conteneur.

Ligne de commande

  1. Exécutez la commande suivante :

    gcloud run services describe SERVICE
  2. Recherchez le paramètre de simultanéité dans la configuration renvoyée.