Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste in parallelo gestite da un servizio Cloud Run.

Limiti di risorse per Cloud Run

Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per andare oltre i limiti che non possono essere aumentati per progetto, crea nuove risorse in un progetto Google Cloud o in una regione diversi.

Risorsa Ambito Descrizione Limite Aumentabile
Servizio per progetto e regione Numero massimo di servizi 1000 No
Job per progetto e regione Numero massimo di job 1000 No
Esecuzione del job per progetto e regione Numero massimo di esecuzioni del job in corso 1000 No
Revisione per servizio Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 No
Revisione per progetto e regione Numero massimo di revisioni che gestiscono il traffico 4000 No
Tag di revisione per progetto e regione Numero massimo di tag di revisione. Quando il numero di tag di revisione raggiunge questo limite, i tag che non hanno una percentuale di traffico vengono eliminati automaticamente in ordine cronologico. 2000 No
Esecuzione del job per job Limite di conservazione per le esecuzioni di job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico 1000 No
Attività di esecuzione del job1 per esecuzione del job Numero massimo di attività in esecuzione in parallelo Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Attività di esecuzione job per esecuzione del job Valore di timeout massimo delle attività 24 ore No
Attività di esecuzione del job esecuzione per job Numero massimo di attività in un singolo job 10.000 No
Attività di esecuzione del job esecuzione per job Numero massimo di nuovi tentativi dell'attività in un job 10 No
Istanza container1 per revisione Numero massimo di istanze di container Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza di container1 per progetto e regione Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza container2 per revisione e regione Numero massimo di istanze di container che utilizzano il traffico VPC diretto in uscita 100-200, a seconda delle configurazioni dell'area geografica selezionate.
Istanza di container per istanza di container Timeout all'avvio, in minuti. 4 No
Memoria per istanza di container Dimensioni massime della memoria, in GiB 32 No
CPU per istanza di container Numero massimo di vCPU 8 No
CPU per progetto e regione CPU totale massima, in milli vCPU, allocata a tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Memoria per progetto e regione Memoria totale massima, in byte, allocata a tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza GPU3 per progetto per regione Numero massimo di istanze di container con GPU 03
Disco per istanza di container Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GB 32 No
Variabile di ambiente per variabile Lunghezza variabile massima, in kB 32 No
Mappatura dei domini per dominio principale e per settimana Numero massimo di certificati SSL 50 No
Mappatura dei domini per dominio principale e per settimana Numero massimo di certificati SSL duplicati 5 No
Token di accesso per istanza di container al secondo Numero massimo di token di accesso univoci generati 50 No
Token di identità per istanza di container al secondo Numero massimo di token di identità univoci generati 50 No
File aperti per istanza di container Numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a
/proc/sys/fs/file-max.
25000 No

1Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere selezionato l'attributo di istanza massima di un revisione. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallismo massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.

  3. Controlla il numero totale di istanze container per l'esecuzione di job in una regione.

2Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere selezionato l'attributo di istanza massima di un revisione utilizzando il VPC diretto in uscita. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallismo massimo di un job che utilizza l'uscita VPC diretta. Una volta concessa in una determinata regione, in quella regione possono fino al limite concesso.

3 Per accedere alla GPU, devi richiedere un aumento delle quote per Total Nvidia L4 GPU allocation, per project per region.

Limiti di rete per Cloud Run

Limiti per le richieste per Cloud Run

Descrizione Limite Note
Numero massimo di richieste in parallelo per istanza 1000
Numero massimo di flussi simultanei per connessione client HTTP/2 100
Tempo massimo prima del timeout per richiesta 60 minuti
Dimensione massima della richiesta HTTP/1 32 MiB se utilizzi un server HTTP/1. Nessun limite se si utilizza il server HTTP/2.
Dimensione massima della risposta HTTP/1 32 MiB se non usi Transfer-Encoding: chunked o meccanismi di streaming
Connessioni in uscita al secondo per istanza 700
Risoluzioni DNS in uscita al secondo per istanza 1000
Richieste in entrata al secondo verso una porta container HTTP/1 per istanza 800 Non si applica alle porte dei contenitori HTTP/2.

Limiti di larghezza di banda per Cloud Run

Alle istanze Cloud Run si applicano i seguenti limiti di larghezza di banda:

Descrizione Limite Note
Numero massimo di bit per istanza per il traffico in uscita tramite VPC diretto 1 Gbps In uscita verso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC.
Numero massimo di bit per istanza, escluso il traffico in uscita su VPC diretto 600 Mbit/s In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso destinazioni nella rete VPC.
Frequenza totale massima di pacchetti per istanza, escluso il traffico in uscita su VPC diretto 64.000 pacchetti al secondo Basato sulla somma dei pacchetti in entrata e dei pacchetti in uscita, escluso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run con una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura all'API Cloud Run Admin Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. 3000 ogni 60 secondi per progetto e regione
Richieste di scrittura all'API Cloud Run Admin Il numero di scritture API ogni 60 secondi per regione. Non si riferisce al numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. 180 per 60 secondi per progetto e regione
Esecuzione job Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. 180 ogni 60 secondi per progetto e regione

Come aumentare la quota

Per richiedere un valore di quota più elevato:

  1. Vai alla pagina Quote e Limiti di sistema:

  2. Individua la quota che vuoi aumentare nella colonna Quota. Puoi utilizzare lo Filtra la casella di ricerca per cercare la tua quota.

  3. Seleziona la casella di controllo accanto alla quota che vuoi aumentare.

  4. Fai clic su Modifica. Viene visualizzata la finestra di dialogo Modifiche alla quota.

  5. (Facoltativo) Se vuoi aumentare il valore della quota oltre il numero indicato Sullo schermo, seleziona Richiedi una quota più alta. Compila il modulo, invialo e salta i passaggi rimanenti.

  6. Nel modulo Modifiche alla quota, inserisci la quota aumentata che vuoi nel campo Nuovo valore. Se viene visualizzato un campo Descrizione richiesta, inserisci una descrizione. Fai clic su Fine.

    Se vedi una casella con il testo "Sono consapevole che questa richiesta rimuoverà eventuali sostituzioni", il valore della quota è impostato al di sotto del valore predefinito. La regolazione del valore di quota predefinito o superiore a quello predefinito rimuove l'override. Per continuare, controlla il riquadro. Scopri di più su sostituzioni delle quote.

    Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila il tuo contatto. i dettagli nella schermata che segue.

  7. Fai clic su Invia richiesta.

Se scopri che non è possibile richiedere una modifica dalla console, richiedi di aumento dall'assistenza clienti Google Cloud.

Le richieste di aggiustamento di Cloud Quotas sono soggette a revisione. Se la tua quota la richiesta di aggiustamento deve essere esaminata, ricevi un'email di conferma di ricezione della tua richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo il giorno dopo aver esaminato la richiesta, riceverai una notifica via email che indica se la tua richiesta è stata approvata.

Per saperne di più sul funzionamento del processo di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.

Creazione di batch di richieste per valori di quota più elevati

Puoi raggruppare le richieste di una quota più alta selezionando la casella di controllo accanto a ogni quota da includere. Il raggruppamento delle richieste in batch può aumentare la quantità necessario a Google Cloud per esaminare la tua richiesta. Per ridurre i tempi di revisione, agrupa le richieste di aggiustamento della quota per prodotto e area. Ad esempio, se vuoi richiedere aggiustamenti delle quote di networking e VM di Compute Engine, crearne una una richiesta per le quote di networking e un'altra richiesta per quote delle VM.