Configurare i limiti di memoria

Questa pagina descrive come impostare i limiti di memoria.

Informazioni sull'utilizzo della memoria

Le istanze Cloud Run che superano il limite di memoria consentito vengono terminate.

I seguenti elementi vengono conteggiati nella memoria disponibile dell'istanza:

  • Eseguire l'eseguibile dell'applicazione (poiché l'eseguibile deve essere caricato memoria)
  • Allocazione di memoria nel processo dell'applicazione
  • Scrittura di file nel file system

La dimensione dell'immagine del container di cui è stato eseguito il deployment non viene conteggiata ai fini del calcolo la memoria.

Impostare e aggiornare i limiti di memoria

Puoi impostare limiti di memoria sui servizi Cloud Run. Per impostazione predefinita, la memoria allocata a ogni istanza di una revisione è di 512 MB.

CPU minime richieste

Quando imposti un limite di memoria, sono obbligatori i seguenti limiti minimi di CPU:

Memoria CPU minime richieste
Più di 4 GB 2
Più di 8 GB 4
Più di 16 GiB 6
Più di 24 GiB 8

Quantità massima di memoria

La quantità massima di memoria che puoi configurare è di 32 gibibyte (32 Gi).

Puoi applicare un limite di memoria massimo utilizzando criteri dell'organizzazione personalizzati.

Memoria minima

L'impostazione della memoria minima varia a seconda che tu utilizzi un ambiente di esecuzione di prima o seconda generazione:

  • 128 MiB per la prima generazione
  • 512 MiB per la seconda generazione

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti seguenti ruoli IAM:

Per un elenco di ruoli e autorizzazioni IAM associati Cloud Run, consulta Ruoli IAM di Cloud Run e le autorizzazioni IAM di Cloud Run. Se il servizio Cloud Run interagisce con le API Google Cloud, come le librerie client di Cloud, consulta la guida alla configurazione dell'identità del servizio. Per saperne di più sulla concessione dei ruoli, consulta le autorizzazioni di deployment e gestisci l'accesso.

Configurare i limiti di memoria

Qualsiasi modifica alla configurazione porta la creazione di una nuova revisione. Anche le revisioni successive acquisiranno automaticamente questa impostazione di configurazione, a meno che non apporti aggiornamenti espliciti per modificarla.

Per i servizi Cloud Run, puoi impostare i limiti di memoria utilizzando la console Google Cloud, la riga di comando gcloud o un file YAML quando crei un nuovo servizio o esegui il deployment di una nuova revisione:

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic su Esegui il deployment del contenitore e seleziona Servizio per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, poi su Modifica ed esegui il deployment di una nuova revisione.

  3. Se stai configurando un nuovo servizio, compila la pagina iniziale delle impostazioni del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.

  4. Fai clic sulla scheda Contenitore.

    immagine

    • Seleziona la dimensione della memoria che preferisci dall'elenco a discesa Memoria.
  5. Fai clic su Crea o Esegui il deployment.

gcloud

Puoi aggiornare l'allocazione della memoria di un determinato servizio utilizzando il seguente comando:

gcloud run services update SERVICE --memory SIZE

Sostituisci SERVICE con il nome del servizio e SIZE con la dimensione della memoria desiderata. Il formato delle dimensioni deve essere un numero in virgola mobile o fisso seguito per un'unità: G o M corrispondente a gigabyte o megabyte, rispettivamente o utilizza la potenza di due equivalenti: Gi o Mi corrispondenti rispettivamente a gibibyte o mebibyte.

Puoi anche impostare i limiti di memoria durante deployment mediante il comando:

gcloud run deploy --image IMAGE_URL --memory SIZE

Sostituisci

  • IMAGE_URL con un riferimento all'immagine container, per ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG di Google.
  • SIZE con i valori descritti sopra.

YAML

  1. Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aggiorna l'attributo memory:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containers:
          - image: IMAGE
            resources:
              limits:
                memory: SIZE

    Sostituisci

    • SERVICE con il nome del tuo servizio Cloud Run
    • IMAGE_URL con un riferimento all'immagine del container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già creati. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
    • SIZE con la dimensione della memoria desiderata. Il formato è un numero a virgola fissa o mobile seguito da un'unità: G o M corrispondenti rispettivamente a gigabyte o megabyte, oppure utilizza gli equivalenti di potenze di 2: Gi o Mi corrispondenti rispettivamente a gibibyte o mebibyte.
    • REVISION con un nuovo nome di revisione o eliminala (se presente). Se fornisci un nuovo nome di revisione, questo deve soddisfare i seguenti criteri:
      • Inizia con SERVICE-
      • Deve contenere solo lettere minuscole, numeri e -
      • Non termina con -
      • Non deve superare i 63 caratteri
  3. Crea o aggiorna il servizio utilizzando il comando seguente:

    gcloud run services replace service.yaml

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta: Comandi Terraform di base.

Aggiungi quanto segue a una risorsa google_cloud_run_v2_service in Terraform sotto template.containers.resources.limits. Sostituisci 512Mi con il limite di memoria che preferisci per il servizio.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-memory-limits"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"

      resources {
        limits = {
          # Memory usage limit (per container)
          memory = "512Mi"
        }
      }
    }
  }
}

Ottimizzare la memoria per i servizi

Per un servizio Cloud Run, puoi determinare il requisito di memoria di picco per un servizio utilizzando quanto segue: (Memoria di attesa) + (Memoria per richiesta) * (Contemporaneità del servizio)

Di conseguenza,

  • Se aumenti la concorrenza del servizio, devi anche aumentare il limite di memoria per tenere conto dei picchi di utilizzo.

  • Se riduci la contemporaneità del servizio, valuta la possibilità di ridurre la memoria per risparmiare sui costi di utilizzo della memoria.

Per ulteriori indicazioni su come ridurre al minimo l'utilizzo della memoria per richiesta, leggi Suggerimenti per lo sviluppo sulle variabili globali.

Visualizzare le impostazioni del limite di memoria

Per visualizzare le impostazioni attuali del limite di memoria per il tuo Servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic sul servizio che ti interessa per aprire Dettagli servizio. .

  3. Fai clic sulla scheda Revisioni.

  4. Nel riquadro dei dettagli a destra, l'impostazione del limite di memoria è elencato nella scheda Contenitore.

gcloud

  1. Utilizza questo comando:

    gcloud run services describe SERVICE
  2. Individua l'impostazione del limite di memoria nel prompt configurazione.