In questa pagina viene descritto come impostare il numero massimo di istanze per il tuo servizio Cloud Run. Specifica il numero massimo di istanze in Cloud Run ti consente di limitare la scalabilità del tuo servizio di conseguenza alle richieste in entrata, sebbene sia possibile superare questo valore massimo per un breve periodo di tempo a causa di circostanze quali picchi di traffico. Utilizza questa impostazione per controllare i costi o per limitare il numero di connessioni a un servizio di supporto, ad esempio a un database.
Per informazioni sui limiti massimi di istanze che potrebbero essere applicati alle tue consulta Limiti massimi di istanze.
Per saperne di più sulla modalità di scalabilità automatica dei container in Cloud Run in più istanze, fai riferimento a Scalabilità automatica delle istanze.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti seguenti ruoli IAM:
-
Sviluppatore Cloud Run (
roles/run.developer
) sul servizio Cloud Run -
Utente account di servizio (
roles/iam.serviceAccountUser
) sull'identità del servizio
Per un elenco di ruoli e autorizzazioni IAM associati Cloud Run, consulta Ruoli IAM di Cloud Run e le autorizzazioni IAM di Cloud Run. Se il tuo servizio Cloud Run si interfaccia con Le API Google Cloud, come le librerie client di Cloud, consultano guida alla configurazione dell'identità dei servizi. Per ulteriori informazioni sulla concessione dei ruoli, consulta autorizzazioni di deployment e gestire l'accesso.
Impostazione e aggiornamento del numero massimo di istanze
Qualsiasi modifica alla configurazione porta la creazione di una nuova revisione. Anche le revisioni successive ricevono automaticamente di questa configurazione, a meno che non apporti aggiornamenti espliciti per modificarla.
Per impostazione predefinita, i servizi Cloud Run sono configurati per lo scale out fino al massimo di 100 istanze.
Puoi modificare l'impostazione del numero massimo di istanze utilizzando la console Google Cloud. la riga di comando gcloud o un file YAML quando crea un nuovo servizio o eseguire il deployment di una nuova revisione.
Console
Nella console Google Cloud, vai a Cloud Run:
Fai clic su Crea servizio se stai configurando un nuovo servizio in cui stai eseguendo il deployment. Se stai configurando un'istanza servizio esistente, fai clic sul servizio e poi su Modifica ed esegui il deployment di una nuova revisione.
Se stai configurando un nuovo servizio, compila il servizio iniziale pagina delle impostazioni come preferisci, poi fai clic su Container, volumi, networking, sicurezza per espandere pagina di configurazione del servizio.
Fai clic sulla scheda Contenitore.
- Nel campo Numero massimo di istanze, specifica
numero massimo di istanze, utilizzando un valore intero compreso tra
1
e il limite massimo
- Nel campo Numero massimo di istanze, specifica
numero massimo di istanze, utilizzando un valore intero compreso tra
Fai clic su Crea o Esegui il deployment.
gcloud
Puoi aggiornare il numero massimo di istanze di un determinato servizio utilizzando il seguente comando:
gcloud run services update SERVICE --max-instances MAX-VALUE
Sostituisci
- SERVICE con il nome del tuo servizio e
- MAX-VALUE con il numero massimo desiderato di container
, utilizzando un valore intero compreso tra
1
fino al limite massimo. Specificadefault
per cancellare qualsiasi impostazione massima dell'istanza e ripristinarla il valore predefinito di 100 istanze.
Puoi anche impostare il numero massimo di istanze durante deployment mediante il comando:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Sostituisci
- IMAGE_URL con un riferimento all'immagine container, per
ad esempio
us-docker.pkg.dev/cloudrun/container/hello:latest
. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già creati. L'URL ha la formaLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE con il numero massimo desiderato di container di Compute Engine.
YAML
Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:
gcloud run services describe SERVICE --format export > service.yaml
Aggiorna l'attributo
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Sostituisci
- SERVICE con il nome del tuo servizio Cloud Run
- MAX-INSTANCE con il numero massimo desiderato.
- REVISION con un nuovo nome di revisione o eliminala (se presente). Se fornisci un nuovo nome per la revisione, deve soddisfare i seguenti criteri:
- Inizia con
SERVICE-
- Contiene solo lettere minuscole, numeri e
-
- Non termina con
-
- Non deve superare i 63 caratteri
- Inizia con
Crea o aggiorna il servizio utilizzando il comando seguente:
gcloud run services replace service.yaml
Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta: Comandi Terraform di base.
La seguente risorsa google_cloud_run_v2_service
specifica un numero massimo
di istanze di 10
in template.scaling
.
Sostituisci 10
con il numero massimo di istanze che preferisci.
Limiti massimi di istanze
Per impostazione predefinita, i servizi Cloud Run sono configurati su un massimo di 100 istanze
Il limite massimo dipende dalla regione del servizio Cloud Run e le relative configurazioni di CPU e memoria.
La pagina delle quote mostra le quote di riferimento per regione.
Il numero massimo di istanze è determinato come il minimo di:
- base di quota regionale / multiplo richiesto di 1 CPU
- base di quota regionale / più richiesto di 2 GB di memoria
Ad esempio, una quota di base di 1000 istanze con 4 GB di memoria o 2 CPU ottiene un limite effettivo di 500.
Se vuoi specificare un numero massimo di istanze maggiore di quello massimo consentito nella regione del servizio Cloud Run, devi richiedere un aumento della quota.
Visualizza le impostazioni per il numero massimo di istanze
Per visualizzare le attuali impostazioni del numero massimo di istanze per il tuo Servizio Cloud Run:
Console
Nella console Google Cloud, vai a Cloud Run:
Fai clic sul servizio che ti interessa per aprire la pagina Dettagli servizio.
Fai clic sulla scheda Revisioni.
Nel riquadro dei dettagli a destra, l'impostazione del numero massimo di istanze è elencato nella scheda Contenitore.
gcloud
Utilizza questo comando:
gcloud run services describe SERVICE
Individua l'impostazione del numero massimo di istanze nel modulo restituito configurazione.