Cette page vous explique comment mettre à l'échelle manuellement votre pool de nœuds de calcul.
Présentation
Le scaling manuel vous permet de définir un nombre d'instances spécifique sans avoir à redéployer. Cela vous permet d'écrire votre propre logique de scaling à l'aide d'un système externe. Pour obtenir un exemple, consultez Kafka Autoscaler.
Facturation avec le scaling manuel
Lorsque vous utilisez le scaling manuel, toutes les instances que vous avez demandées sont facturées en tant qu'instances actives, même si elles sont inactives. Pour en savoir plus sur la facturation, consultez la page des tarifs.
Rôles requis
Pour obtenir les autorisations nécessaires pour déployer des pools de nœuds de calcul Cloud Run, demandez à votre administrateur de vous accorder les rôles IAM suivants :
-
Développeur Cloud Run (
roles/run.developer
) sur le service Cloud Run -
Utilisateur du compte de service (
roles/iam.serviceAccountUser
) sur l'identité du service -
Lecteur Artifact Registry (
roles/artifactregistry.reader
) sur le dépôt Artifact Registry de l'image de conteneur déployée (le cas échéant)
Pour obtenir la liste des rôles et des autorisations IAM associés à Cloud Run, consultez les sections Rôles IAM Cloud Run et Autorisations IAM Cloud Run. Si votre pool de nœuds de calcul Cloud Run communique avec des APIGoogle Cloud , telles que des bibliothèques clientes Cloud, consultez le guide de configuration de l'identité du service. Pour en savoir plus sur l'attribution de rôles, consultez les pages Autorisations de déploiement et Gérer les accès.
Configurer le scaling
La modification du mode de scaling ou du nombre d'instances manuelles ne crée pas de révision.
Pour configurer le mode de scaling, utilisez la console Google Cloud ou Google Cloud CLI :
Console
Dans la console Google Cloud , accédez à Cloud Run :
Si vous configurez un nouveau pool de nœuds de calcul, sélectionnez Pools de nœuds de calcul dans le menu, puis cliquez sur Déployer un conteneur. Si vous configurez un pool de nœuds de calcul existant, cliquez sur celui-ci pour afficher son panneau de détails, puis sur l'icône en forme de crayon à côté de Scaling (Mise à l'échelle) en haut à droite du panneau de détails.
Localisez le formulaire Scaling (pour un nouveau pool de nœuds de calcul) ou le formulaire Modifier le scaling pour un pool de nœuds de calcul existant.
Dans le champ Nombre d'instances, spécifiez le nombre d'instances de conteneur pour le service.
Terminez la spécification.
Cliquez sur Créer pour un nouveau pool de nœuds de calcul ou sur Enregistrer pour un pool de nœuds de calcul existant.
gcloud
Pour spécifier le scaling d'un nouveau pool de nœuds de calcul, utilisez la commande deploy :
gcloud beta run worker-pools deploy WORKER_POOL \ --scaling=INSTANCE_COUNT \ --image IMAGE_URL
Remplacez les éléments suivants :
- WORKER_POOL : nom de votre pool de nœuds de calcul.
- INSTANCE_COUNT : nombre d'instances pour le pool de nœuds de calcul.
Cela définit le pool de nœuds de calcul sur le scaling manuel. Spécifiez la valeur
0
pour désactiver le pool de nœuds de calcul. - IMAGE_URL : référence à l'image de conteneur contenant le pool de nœuds de calcul, par exemple
us-docker.pkg.dev/cloudrun/container/worker-pool:latest
.
Spécifiez le scaling pour un pool de nœuds de calcul existant à l'aide de la commande update suivante :
gcloud beta run worker-pools update WORKER_POOL \ --scaling=INSTANCE_COUNT
Terraform
Pour savoir comment appliquer ou supprimer une configuration Terraform, consultez la page Commandes Terraform de base.
resource "google_cloud_run_v2_worker_pool" "default" {
name = "WORKER_POOL"
location = "REGION"
launch_stage = "BETA"
template {
containers {
image = "IMAGE_URL"
}
}
scaling {
scaling_mode = "MANUAL"
manual_instance_count = "INSTANCE_COUNT"
}
}
Remplacez les éléments suivants :
- WORKER_POOL : nom du pool de nœuds de calcul.
- REGION : région Google Cloud , par exemple
europe-west1
. - IMAGE_URL : référence à l'image de conteneur contenant le pool de nœuds de calcul, par exemple
us-docker.pkg.dev/cloudrun/container/worker-pool:latest
. - INSTANCE_COUNT : nombre d'instances pour le pool de nœuds de calcul.
Cela définit le pool de nœuds de calcul sur le scaling manuel. Spécifiez la valeur
0
pour désactiver le pool de nœuds de calcul.
Afficher la configuration du scaling pour un pool de nœuds de calcul
Dans la console Google Cloud , accédez à Cloud Run :
Cliquez sur Pools de nœuds de calcul pour afficher la liste des pools de nœuds de calcul déployés.
Cliquez sur le pool de workers que vous souhaitez examiner pour afficher son volet d'informations.
Le paramètre de scaling actuel est affiché au-dessus de la liste des révisions du pool de nœuds de calcul : Scaling : manuel (instances : ).
Désactiver un pool de nœuds de calcul
Pour désactiver un pool de nœuds de calcul, utilisez la commande suivante pour définir la mise à l'échelle sur zéro :
gcloud beta run worker-pools update WORKER_POOL --scaling=0
Remplacez WORKER_POOL par le nom de votre pool de nœuds de calcul.