Configurare i limiti di memoria

Questa pagina descrive come impostare i limiti di memoria.

Informazioni sull'utilizzo della memoria

Le istanze Cloud Run che superano il limite di memoria consentito vengono terminate.

I seguenti elementi vengono conteggiati nella memoria disponibile dell'istanza:

  • Eseguire l'eseguibile dell'applicazione (poiché l'eseguibile deve essere caricato nella memoria)
  • Allocazione di memoria nel processo dell'applicazione
  • Scrittura di file nel file system

Le dimensioni dell'immagine del contenitore di cui è stato eseguito il deployment non vengono conteggiate ai fini del calcolo della memoria disponibile.

Impostare e aggiornare i limiti di memoria

Puoi impostare limiti di memoria sui servizi Cloud Run. Per impostazione predefinita, la memoria allocata a ogni istanza di una revisione è di 512 MB.

CPU minime richieste

Quando imposti un limite di memoria, sono obbligatori i seguenti limiti minimi di CPU:

Memoria CPU minime richieste
Più di 4 GB 2
Più di 8 GB 4
Più di 16 GiB 6
Più di 24 GB 8

Quantità massima di memoria

La quantità massima di memoria che puoi configurare è di 32 gibibyte (32 Gi).

Puoi applicare un limite massimo di memoria utilizzando criteri dell'organizzazione personalizzati.

Memoria minima

L'impostazione della memoria minima varia a seconda che tu utilizzi un ambiente di esecuzione di prima o seconda generazione:

  • 128 MiB per la prima generazione
  • 512 MiB per la seconda generazione

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per un elenco dei ruoli e delle autorizzazioni IAM associati a Cloud Run, consulta Ruoli IAM di Cloud Run e Autorizzazioni IAM di Cloud Run. Se il servizio Cloud Run interagisce con le API Google Cloud, come le librerie client di Cloud, consulta la guida alla configurazione dell'identità del servizio. Per ulteriori informazioni sulla concessione dei ruoli, consulta le autorizzazioni di deployment e gestisci l'accesso.

Configurare i limiti di memoria

Qualsiasi modifica alla configurazione comporta la creazione di una nuova revisione. Anche le revisioni successive acquisiranno automaticamente questa impostazione di configurazione, a meno che non apporti aggiornamenti espliciti per modificarla.

Per i servizi Cloud Run, puoi impostare i limiti di memoria utilizzando la console Google Cloud, la riga di comando gcloud o un file YAML quando crei un nuovo servizio o esegui il deployment di una nuova revisione:

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic su Esegui il deployment del contenitore e seleziona Servizio per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, poi su Modifica ed esegui il deployment di una nuova revisione.

  3. Se stai configurando un nuovo servizio, compila la pagina iniziale delle impostazioni del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.

  4. Fai clic sulla scheda Contenitore.

    immagine

    • Seleziona la dimensione della memoria che preferisci dall'elenco a discesa Memoria.
  5. Fai clic su Crea o Esegui il deployment.

gcloud

Puoi aggiornare l'allocazione della memoria di un determinato servizio utilizzando il seguente comando:

gcloud run services update SERVICE --memory SIZE

Sostituisci SERVICE con il nome del servizio e SIZE con la dimensione della memoria desiderata. Il formato delle dimensioni è un numero a virgola fissa o mobile seguito da un'unità: G o M corrispondenti rispettivamente a gigabyte o megabyte oppure utilizza gli equivalenti di potenza di due: Gi o Mi corrispondenti rispettivamente a gibibyte o mebibyte.

Puoi anche impostare i limiti di memoria durante il deployment utilizzando il comando:

gcloud run deploy --image IMAGE_URL --memory SIZE

Sostituisci

  • IMAGE_URL con un riferimento all'immagine del container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • SIZE con i valori descritti sopra.

YAML

  1. Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aggiorna l'attributo memory:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containers:
          - image: IMAGE
            resources:
              limits:
                memory: SIZE

    Sostituisci

    • SERVICE con il nome del servizio Cloud Run
    • IMAGE_URL con un riferimento all'immagine del container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
    • SIZE con la dimensione della memoria desiderata. Il formato è un numero a virgola fissa o mobile seguito da un'unità: G o M corrispondenti rispettivamente a gigabyte o megabyte, oppure utilizza gli equivalenti di potenze di 2: Gi o Mi corrispondenti rispettivamente a gibibyte o mebibyte.
    • REVISION con un nuovo nome della revisione o eliminala (se presente). Se fornisci un nuovo nome di revisione, questo deve soddisfare i seguenti criteri:
      • Inizia con SERVICE-
      • Deve contenere solo lettere minuscole, numeri e -
      • Non termina con -
      • Non deve superare i 63 caratteri
  3. Crea o aggiorna il servizio utilizzando il seguente comando:

    gcloud run services replace service.yaml

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.

Aggiungi quanto segue a una risorsa google_cloud_run_v2_service nella configurazione Terraform, in template.containers.resources.limits. Sostituisci 512Mi con il limite di memoria che preferisci per il servizio.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-memory-limits"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"

      resources {
        limits = {
          # Memory usage limit (per container)
          memory = "512Mi"
        }
      }
    }
  }
}

Ottimizzare la memoria per i servizi

Per un servizio Cloud Run, puoi determinare il requisito di memoria di picco per un servizio utilizzando quanto segue: (Memoria di attesa) + (Memoria per richiesta) * (Contemporaneità del servizio)

Di conseguenza,

  • Se aumenti la concorrenza del servizio, devi anche aumentare il limite di memoria per tenere conto dei picchi di utilizzo.

  • Se riduci la concorrenza del servizio, valuta la possibilità di ridurre il limite di memoria per risparmiare sui costi di utilizzo della memoria.

Per ulteriori indicazioni su come ridurre al minimo l'utilizzo di memoria per richiesta, consulta Suggerimenti per lo sviluppo sulle variabili globali.

Visualizzare le impostazioni del limite di memoria

Per visualizzare le impostazioni attuali del limite di memoria per il servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic sul servizio che ti interessa per aprire la pagina Dettagli servizio.

  3. Fai clic sulla scheda Revisioni.

  4. Nel riquadro dei dettagli a destra, l'impostazione del limite di memoria è elencata nella scheda Contenitore.

gcloud

  1. Utilizza il seguente comando:

    gcloud run services describe SERVICE
  2. Individua l'impostazione del limite di memoria nella configurazione restituita.