Définir la simultanéité

Découvrez comment définir le nombre maximal de requêtes pouvant être traitées simultanément par une instance de conteneur donnée dans Cloud Run for Anthos sur Google Cloud. Apprenez-en plus sur la simultanéité.

Tout changement de configuration entraîne la création d'une révision. Les révisions ultérieures obtiennent aussi automatiquement le même paramètre de configuration, à moins que vous ne le mettiez explicitement à jour.

Vous pouvez configurer les paramètres de simultanéité à l'aide de Cloud Console ou de l'outil de ligne de commande gcloud lorsque vous déployez un nouveau service, ou mettez à jour un service existant et déployez une révision :

Console

  1. Accédez à Cloud Run for Anthos sur Google Cloud.

  2. Cliquez sur Créer un service si vous configurez un nouveau service sur lequel effectuer un déploiement. Si vous configurez un service existant, cliquez sur celui-ci, puis sur Modifier et déployer la nouvelle révision.

  3. Sous Paramètres avancés, cliquez sur Conteneur.

    image

  4. Définissez la valeur de simultanéité souhaitée dans la zone de texte Maximum requests per container (Nombre maximal de requêtes par conteneur) :

  5. Cliquez sur Créer ou Déployer.

Ligne de commande

  • Pour les services existants, définissez le nombre maximal de requêtes simultanées en exécutant la commande gcloud kuberun core services update avec le paramètre --concurrency :

    gcloud kuberun core services update SERVICE --concurrency CONCURRENCY
    

    Remplacez :

    • SERVICE par le nom de votre service ;
    • CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiez default pour effacer les paramètres de simultanéité : --concurrency default.
  • Pour les nouveaux services, définissez le nombre maximal de requêtes simultanées en exécutant la commande gcloud kuberun core services create avec le paramètre --concurrency :

    gcloud kuberun core services create SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
    

    Remplacez :

    • SERVICE par le nom de votre service ;
    • IMAGE_URL par une référence à l'image de conteneur, par exemple gcr.io/myproject/my-image:latest ;
    • CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiez default pour effacer les paramètres de simultanéité : --concurrency default.

YAML

Pour utiliser un fichier YAML afin de modifier la configuration de votre service existant, vous devez obtenir une copie de la configuration actuelle, modifier et enregistrer vos modifications dans un fichier local, puis déployer ces modifications dans votre service.

  1. Affichez en YAML puis copiez la configuration de votre service dans un fichier local, par exemple service.yaml :

    gcloud kuberun core services describe SERVICE --format yaml

    Remplacez SERVICE par le nom de votre service Cloud Run pour Anthos.

  2. Dans votre fichier local, mettez à jour l'attribut containerConcurrency :

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Remplacez :

    • SERVICE par le nom de votre service Cloud Run for Anthos sur Google Cloud ;
    • CONCURRENCY par le nombre maximal de requêtes simultanées par instance de conteneur. Spécifiez default pour effacer les paramètres de simultanéité : --concurrency default.
  3. Remplacez la configuration du service en utilisant la commande suivante :

    gcloud beta run services replace service.yaml