Imposta il numero massimo di istanze (servizi)

In questa pagina viene descritto come impostare il numero massimo di istanze per il tuo servizio Cloud Run. La specifica del numero massimo di istanze in Cloud Run ti consente di limitare il ridimensionamento del servizio in risposta alle richieste in entrata, anche se questa impostazione massima può essere superata per un breve periodo a causa di circostanze come i picchi di traffico. Utilizza questa impostazione per controllare i costi o per limitare il numero di connessioni a un servizio di supporto, ad esempio a un database.

Per informazioni sui limiti massimi di istanze che potrebbero essere applicati alle tue consulta Limiti massimi di istanze.

Per ulteriori informazioni su come Cloud Run esegue la scalabilità automatica delle istanze di container, consulta Scalabilità automatica delle istanze.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti seguenti ruoli IAM:

Per un elenco dei ruoli e delle autorizzazioni IAM associati a Cloud Run, consulta Ruoli IAM di Cloud Run e Autorizzazioni IAM di Cloud Run. Se il tuo servizio Cloud Run si interfaccia con Le API Google Cloud, come le librerie client di Cloud, consultano guida alla configurazione dell'identità dei servizi. Per saperne di più sulla concessione dei ruoli, consulta le autorizzazioni di deployment e gestisci l'accesso.

Impostazione e aggiornamento del numero massimo di istanze

Qualsiasi modifica alla configurazione comporta la creazione di una nuova revisione. Anche le revisioni successive ricevono automaticamente di questa configurazione, a meno che non apporti aggiornamenti espliciti per modificarla.

Per impostazione predefinita, i servizi Cloud Run sono configurati per eseguire il ridimensionamento fino a un massimo di 100 istanze.

Puoi modificare l'impostazione delle istanze massime utilizzando la console Google Cloud, la riga di comando gcloud o un file YAML quando crei un nuovo servizio o esegui il deployment di una nuova revisione.

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic su Esegui il deployment del contenitore e seleziona Servizio per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, poi su Modifica ed esegui il deployment di una nuova revisione.

  3. Se stai configurando un nuovo servizio, compila la pagina iniziale delle impostazioni del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.

  4. Fai clic sulla scheda Contenitore.

    immagine

    • Nel campo Numero massimo di istanze, specifica numero massimo di istanze, utilizzando un valore intero compreso tra 1 e il limite massimo
  5. Fai clic su Crea o Esegui il deployment.

gcloud

Puoi aggiornare il numero massimo di istanze di un determinato servizio utilizzando il seguente comando:

gcloud run services update SERVICE --max-instances MAX-VALUE

Sostituisci

  • SERVICE con il nome del tuo servizio e
  • MAX-VALUE con il numero massimo desiderato di container , utilizzando un valore intero compreso tra 1 fino al limite massimo. Specifica default per cancellare qualsiasi impostazione di istanze massime e ripristinare il valore predefinito di 100 istanze.

Puoi anche impostare il numero massimo di istanze durante il deployment utilizzando il comando:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Sostituisci

  • IMAGE_URL con un riferimento all'immagine container, per ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già creati. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG di Google.
  • MAX-VALUE con il numero massimo di istanze container preferito.

YAML

  1. Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aggiorna l'attributo autoscaling.knative.dev/maxScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Sostituisci

    • SERVICE con il nome del tuo servizio Cloud Run
    • MAX-INSTANCE con il numero massimo desiderato.
    • REVISION con un nuovo nome di revisione o eliminala (se presente). Se fornisci un nuovo nome di revisione, questo deve soddisfare i seguenti criteri:
      • Inizia con SERVICE-
      • Deve contenere solo lettere minuscole, numeri e -
      • Non termina con -
      • Non deve superare i 63 caratteri
  3. Crea o aggiorna il servizio utilizzando il seguente comando:

    gcloud run services replace service.yaml

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.

La seguente risorsa google_cloud_run_v2_service specifica un numero massimo di istanze di 10 in template.scaling. Sostituisci 10 con il numero massimo di istanze desiderato.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Limiti di istanze massime

Per impostazione predefinita, i servizi Cloud Run sono configurati per un massimo di 100 istanze

Il limite massimo dipende dalla regione del servizio Cloud Run e le relative configurazioni di CPU e memoria.

La pagina delle quote mostra le quote di riferimento per regione.

Il numero massimo di istanze è determinato come il minimo di:

  • base di quota regionale / multiplo richiesto di 1 CPU
  • base di riferimento della quota regionale/moltiplicatore richiesto di memoria da 2 GB

Ad esempio, una quota di base di 1000 istanze con 4 GB di memoria o 2 CPU avrà un limite effettivo di 500.

Se vuoi specificare un numero massimo di istanze superiore a quello consentito nella regione del servizio Cloud Run, devi richiedere un aumento della quota.

Visualizzare le impostazioni relative al numero massimo di istanze

Per visualizzare le impostazioni correnti delle istanze massime per il servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic sul servizio che ti interessa per aprire Dettagli servizio. .

  3. Fai clic sulla scheda Revisioni.

  4. Nel riquadro dei dettagli a destra, l'impostazione del numero massimo di istanze è elencato nella scheda Contenitore.

gcloud

  1. Utilizza il seguente comando:

    gcloud run services describe SERVICE
  2. Individua l'impostazione del numero massimo di istanze nel modulo restituito configurazione.