Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste in parallelo gestite da un servizio Cloud Run.

Limiti delle risorse per Cloud Run

Risorsa Descrizione Limite Aumentabile Ambito
Servizio Numero massimo di servizi 1000 No per progetto e regione
Job Numero massimo di job 1000 No per progetto e regione
Esecuzione di servizi e job Numero massimo di servizi ed esecuzioni del job in esecuzione 1000 No per progetto e regione
Revisione Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 No per servizio
Revisione ed esecuzione del job Numero massimo di revisioni che gestiscono il traffico ed esecuzioni del job in esecuzione 4000 No per progetto e regione
Tag di revisione Numero massimo di tag di revisione 2000 No per progetto e regione
Esecuzione del job Limite di conservazione per le esecuzioni di job completate. Quando il numero di esecuzioni completate di un job raggiunge questo limite, vengono eliminate automaticamente in ordine storico. 1000 No per job
Attività di esecuzione job1 Numero massimo di attività in esecuzione in parallelo Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. esecuzione per job
Attività di esecuzione job Valore di timeout massimo delle attività 24 ore No esecuzione per job
Attività di esecuzione job Numero massimo di attività in un singolo job 10.000 No esecuzione per job
Attività di esecuzione job Numero massimo di nuovi tentativi dell'attività in un job 10 No esecuzione per job
Istanza container1 Numero massimo di istanze di container Dipende dalle configurazioni di CPU e memoria e di CPU selezionate. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per revisione
Istanza container1 Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per progetto e regione
Istanza container2 Numero massimo di istanze di container che utilizzano il traffico VPC diretto in uscita 100-200, a seconda delle configurazioni dell'area geografica selezionate. per revisione e regione
Istanza di container Timeout all'avvio, in minuti. 4 No per istanza di container
Memoria Dimensione massima della memoria, in GiB 32 No per istanza di container
CPU Numero massimo di vCPU 8 No per istanza di container
Disco Massimo file system in memoria scrivibile, limitato dalla memoria dell'istanza, in GiB 32 No per istanza di container
Variabile di ambiente Lunghezza variabile massima, in kB 32 No per variabile
Mappatura dei domini Numero massimo di certificati SSL 50 No per dominio principale e per settimana
Mappatura dei domini Numero massimo di certificati SSL duplicati 5 No per dominio principale e per settimana
Token di accesso Numero massimo di token di accesso univoci generati 50 No per istanza di container al secondo
Token di identità Numero massimo di token di identità univoci generati 50 No per istanza di container al secondo

1Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere selezionato per l'attributo maximum instance di una revisione. Una volta concessa in una determinata regione, tutte le revisioni in quell'area possono raggiungere il limite concesso.

  2. Controlla il massimo parallelism di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

  3. Controlla il totale delle istanze di container per l'esecuzione di job in una regione.

2Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo di istanza massima di una revisione utilizzando il traffico VPC diretto in uscita. Una volta concessa in una determinata regione, tutte le revisioni in quell'area possono raggiungere il limite concesso.

  2. Controlla il massimo parallelism di un job utilizzando il VPC diretto in uscita. Una volta concesso in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

Limiti di networking per Cloud Run

Limiti per le richieste per Cloud Run

Descrizione Limite Note
Numero massimo di richieste in parallelo per istanza 1000
Numero massimo di flussi simultanei per connessione client HTTP/2 100
Tempo massimo prima del timeout per richiesta 60 minuti
Dimensione massima della richiesta HTTP/1 32 MiB se viene utilizzato un server HTTP/1. Nessun limite se si utilizza il server HTTP/2.
Dimensione massima della risposta HTTP/1 32 MiB se non usi Transfer-Encoding: chunked o meccanismi di streaming
Connessioni in uscita al secondo per istanza 700
Richieste in entrata al secondo verso una porta container HTTP/1 per istanza 800 Non si applica alle porte del container HTTP/2.

Limiti di larghezza di banda per Cloud Run

Alle istanze Cloud Run si applicano i seguenti limiti di larghezza di banda:

Descrizione Limite Note
Numero massimo di byte per istanza per il traffico in uscita tramite VPC diretto 1 Gbps In uscita verso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC.
Numero massimo di byte per istanza, escluso il traffico in uscita tramite VPC diretto 75 megabyte al secondo (Mbps) Basato sulla somma dei byte in entrata e dei byte in uscita, escluso il traffico in uscita tramite VPC diretto verso destinazioni sulla rete VPC.
Frequenza totale massima di pacchetti per istanza, escluso il traffico in uscita su VPC diretto 64.000 pacchetti al secondo Basato sulla somma dei pacchetti in entrata e dei pacchetti in uscita, escluso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura all'API Cloud Run Admin Il numero di letture API ogni 60 secondi per regione. Non si riferisce al numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. 3000 ogni 60 secondi per progetto e regione
Richieste di scrittura all'API Cloud Run Admin Il numero di scritture API ogni 60 secondi per regione. Non si riferisce al numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. 180 ogni 60 secondi per progetto e regione
Esecuzione job Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. 180 ogni 60 secondi per progetto e regione

Come aumentare la quota

Per richiedere un valore di quota più elevato utilizzando la console Google Cloud:

  1. Vai alla pagina Quote:

    Vai a Quote

    I passaggi rimanenti verranno visualizzati automaticamente nella console Google Cloud.

  2. Nella pagina Quote, individua la quota che vuoi aumentare nella colonna Quota.

    Puoi utilizzare la casella di ricerca Filtro per cercare la quota.

  3. Seleziona la casella di controllo a sinistra della quota.

  4. Fai clic su MODIFICA QUOTE. Viene visualizzato il modulo Modifiche alla quota.

  5. Nel modulo Modifiche alla quota, inserisci nel campo Nuovo limite la quota aumentata che vuoi per il tuo progetto.

  6. Compila eventuali campi aggiuntivi nel modulo, poi fai clic su FINE.

  7. Fai clic su INVIA RICHIESTA.

Sebbene la procedura descritta in precedenza si applichi alla maggior parte delle richieste di aumento della quota, potresti incorrere in una delle seguenti eccezioni:

  • Nel caso in cui ci sia un limite di utilizzo esistente, quest'ultimo deve essere rimosso prima di poter aumentare la quota. Ti verrà presentata un'informativa e un contratto. L'informativa indica che il limite di utilizzo verrà eliminato e che il limite verrà aggiornato immediatamente al limite predefinito. La tua richiesta di aumento della quota verrà quindi elaborata da Google Cloud normalmente.
  • A volte la console Google Cloud ti reindirizza a un modulo separato per richiedere un aumento del limite. Dopo aver inviato il modulo, Google Cloud conferma la tua richiesta via email.
  • Alcune quote non possono essere aggiornate utilizzando la console Google Cloud. Se non riesci a modificare una quota dalla console, richiedi l'aumento all'assistenza clienti Google Cloud. Il team di fatturazione non gestisce l'aumento del limite di quota.

Google consiglia di creare una richiesta di aumento della quota diversa per ogni classe di risorse. Ad esempio, devi separare gli aumenti della quota di rete per progetto dagli aumenti della quota di Compute Engine non di rete. Se vengono combinate classi di richieste diverse, una richiesta di aumento può ritardare il batch se la sua approvazione richiede più tempi di valutazione.

Se la richiesta di aumento della quota richiede l'approvazione, riceverai un'email da Google Cloud che conferma la tua richiesta. Se hai bisogno di ulteriore assistenza, puoi rispondere all'email. L'assistenza clienti Google Cloud in genere elabora la richiesta entro 2-3 giorni lavorativi. L'assistenza clienti Google Cloud ti invia quindi una seconda email con cui ti viene comunicato se l'aumento di quota è stato approvato o negato. L'email fornisce la data di validità dell'aumento, se applicabile.

Per saperne di più sul funzionamento del processo di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.