Découvrez comment définir le nombre maximal de requêtes pouvant être traitées simultanément par une instance de conteneur donnée dans Cloud Run for Anthos sur Google Cloud. Apprenez-en plus sur la simultanéité.
Tout changement de configuration entraîne la création d'une révision. Les révisions ultérieures obtiennent aussi automatiquement le même paramètre de configuration, à moins que vous ne le mettiez explicitement à jour.
Vous pouvez configurer les paramètres de simultanéité à l'aide de Cloud Console ou de l'outil de ligne de commande gcloud
lorsque vous déployez un nouveau service, ou mettez à jour un service existant et déployez une révision :
Console
Cliquez sur Créer un service si vous configurez un nouveau service sur lequel effectuer un déploiement. Si vous configurez un service existant, cliquez sur celui-ci, puis sur Modifier et déployer la nouvelle révision.
Sous Paramètres avancés, cliquez sur Conteneur.
Définissez la valeur de simultanéité souhaitée dans la zone de texte Maximum requests per container (Nombre maximal de requêtes par conteneur) :
Cliquez sur Créer ou Déployer.
Ligne de commande
Pour les services existants, définissez le nombre maximal de requêtes simultanées en exécutant la commande
gcloud kuberun core services update
avec le paramètre--concurrency
:gcloud kuberun core services update SERVICE --concurrency CONCURRENCY
Remplacez :
SERVICE
par le nom de votre service ;CONCURRENCY
par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiezdefault
pour effacer les paramètres de simultanéité :--concurrency default
.
Pour les nouveaux services, définissez le nombre maximal de requêtes simultanées en exécutant la commande
gcloud kuberun core services create
avec le paramètre--concurrency
:gcloud kuberun core services create SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
Remplacez :
SERVICE
par le nom de votre service ;- IMAGE_URL par une référence à l'image de conteneur, par exemple
gcr.io/myproject/my-image:latest
; CONCURRENCY
par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiezdefault
pour effacer les paramètres de simultanéité :--concurrency default
.
YAML
Pour utiliser un fichier YAML afin de modifier la configuration de votre service existant, vous devez obtenir une copie de la configuration actuelle, modifier et enregistrer vos modifications dans un fichier local, puis déployer ces modifications dans votre service.
Affichez en YAML puis copiez la configuration de votre service dans un fichier local, par exemple
service.yaml
:gcloud kuberun core services describe SERVICE --format yaml
Remplacez SERVICE par le nom de votre service Cloud Run pour Anthos.
Dans votre fichier local, mettez à jour l'attribut
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
Remplacez :
- SERVICE par le nom de votre service Cloud Run for Anthos sur Google Cloud ;
- CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiez
default
pour effacer les paramètres de simultanéité :--concurrency default
.
Remplacez la configuration du service en utilisant la commande suivante :
gcloud beta run services replace service.yaml