Questa pagina descrive come impostare il numero massimo di istanze che possono essere utilizzate per il servizio Cloud Run.
La specifica del numero massimo di istanze in Cloud Run ti consente di limitare il ridimensionamento del servizio in risposta alle richieste in entrata, anche se questa impostazione massima può essere superata per un breve periodo a causa di circostanze come i picchi di traffico.
Puoi utilizzare questa impostazione per controllare i costi o limitare il numero di connessioni a un servizio di backend, ad esempio a un database.
Per informazioni sui limiti massimi di istanze che potrebbero essere applicati al tuo servizio, consulta Limiti massimi di istanze.
Per ulteriori informazioni su come Cloud Run esegue la scalabilità automatica delle istanze di container, consulta Scalabilità automatica delle istanze.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Cloud Run Developer (
roles/run.developer
) nel servizio Cloud Run -
Utente account di servizio (
roles/iam.serviceAccountUser
) nell'identità del servizio
Per un elenco dei ruoli e delle autorizzazioni IAM associati a Cloud Run, consulta Ruoli IAM di Cloud Run e Autorizzazioni IAM di Cloud Run. Se il servizio Cloud Run interagisce con le API Google Cloud, come le librerie client di Cloud, consulta la guida alla configurazione dell'identità del servizio. Per ulteriori informazioni sulla concessione dei ruoli, consulta le autorizzazioni di deployment e gestisci l'accesso.
Impostare e aggiornare le istanze massime
Qualsiasi modifica alla configurazione comporta la creazione di una nuova revisione. Anche le revisioni successive acquisiranno automaticamente questa impostazione di configurazione, a meno che non apporti aggiornamenti espliciti per modificarla.
Per impostazione predefinita, i servizi Cloud Run sono configurati per eseguire lo scaling fino a un massimo di 100 istanze.
Puoi modificare l'impostazione delle istanze massime utilizzando la console Google Cloud, Google Cloud CLI o un file YAML quando crei un nuovo servizio o esegui il deployment di una nuova revisione.
Console
Nella console Google Cloud, vai a Cloud Run:
Fai clic su Esegui il deployment del contenitore e seleziona Servizio per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, poi su Modifica ed esegui il deployment di una nuova revisione.
Se stai configurando un nuovo servizio, compila la pagina iniziale delle impostazioni del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.
Fai clic sulla scheda Contenitore.
- Nel campo Numero massimo di istanze, specifica il numero massimo di istanze desiderato utilizzando un valore intero compreso tra
1
e il limite massimo.
- Nel campo Numero massimo di istanze, specifica il numero massimo di istanze desiderato utilizzando un valore intero compreso tra
Fai clic su Crea o Esegui il deployment.
gcloud
Puoi aggiornare il numero massimo di istanze di un determinato servizio utilizzando il seguente comando:
gcloud run services update SERVICE --max-instances MAX-VALUE
Sostituisci
- SERVICE con il nome del servizio e
- MAX-VALUE con il numero massimo di istanze del contenitore desiderato, utilizzando qualsiasi valore intero da
1
al limite massimo. Specificadefault
per cancellare qualsiasi impostazione di istanze massime e ripristinare il valore predefinito di 100 istanze.
Puoi anche impostare il numero massimo di istanze durante il deployment utilizzando il comando:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Sostituisci
- IMAGE_URL con un riferimento all'immagine del container, ad esempio
us-docker.pkg.dev/cloudrun/container/hello:latest
. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la formaLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE con il numero massimo di istanze container preferito.
YAML
Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:
gcloud run services describe SERVICE --format export > service.yaml
Aggiorna l'attributo
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Sostituisci
- SERVICE con il nome del servizio Cloud Run
- MAX-INSTANCE con il numero massimo richiesto.
- REVISION con un nuovo nome della revisione o eliminala (se presente). Se fornisci un nuovo nome di revisione, questo deve soddisfare i seguenti criteri:
- Inizia con
SERVICE-
- Deve contenere solo lettere minuscole, numeri e
-
- Non termina con
-
- Non deve superare i 63 caratteri
- Inizia con
Crea o aggiorna il servizio utilizzando il seguente comando:
gcloud run services replace service.yaml
Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.
La seguente risorsa google_cloud_run_v2_service
specifica un numero massimo di istanze di 10
in template.scaling
.
Sostituisci 10
con il numero massimo di istanze richiesto.
Visualizzare le impostazioni relative al numero massimo di istanze
Per visualizzare le impostazioni correnti delle istanze massime per il servizio Cloud Run:
Console
Nella console Google Cloud, vai a Cloud Run:
Fai clic sul servizio che ti interessa per aprire la pagina Dettagli servizio.
Fai clic sulla scheda Revisioni.
Nel riquadro dei dettagli a destra, l'impostazione delle istanze massime è elencata nella scheda Contenitore.
gcloud
Utilizza il seguente comando:
gcloud run services describe SERVICE
Individua l'impostazione del numero massimo di istanze nella configurazione restituita.