Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste in parallelo gestite da un servizio Cloud Run.

Limiti di risorse per Cloud Run

Risorsa Descrizione Limite Aumentabile Ambito
Servizio Numero massimo di servizi 1000 No per progetto e regione
Job Numero massimo di job 1000 No per progetto e regione
Esecuzione di servizi e job Numero massimo di servizi ed esecuzioni di job in esecuzione 1000 No per progetto e regione
Revisione Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 No per servizio
Revisione ed esecuzione job Numero massimo di revisioni che gestiscono il traffico ed esecuzione di job 4000 No per progetto e regione
Tag di revisione Numero massimo di tag di revisione 2000 No per progetto e regione
Esecuzione del job Limite di conservazione per le esecuzioni di job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, queste vengono eliminate automaticamente in ordine storico. 1000 No per job
Attività di esecuzione del job1 Numero massimo di attività in esecuzione in parallelo Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per esecuzione del job
Attività di esecuzione del job Valore di timeout massimo delle attività 24 ore No per esecuzione del job
Attività di esecuzione del job Numero massimo di attività in un singolo job 10.000 No per esecuzione del job
Attività di esecuzione del job Numero massimo di nuovi tentativi di attività in un job 10 No per esecuzione del job
Istanza container1 Numero massimo di istanze di container Dipende dalla regione selezionata, nonché dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per revisione
Istanza container1 Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. per progetto e regione
Istanza container2 Numero massimo di istanze di container che utilizzano il traffico in uscita da VPC diretto 100-200, a seconda delle configurazioni dell'area geografica selezionate. per revisione e regione
Istanza di container Timeout avvio, in minuti 4 No per istanza di container
Memoria Dimensione massima della memoria, in GiB 32 No per istanza di container
CPU Numero massimo di vCPU 8 No per istanza di container
Disco Numero massimo di file system in memoria scrivibile, limitato per istanza, in GiB 32 No per istanza di container
Variabile di ambiente Lunghezza variabile massima, in kB 32 No per variabile
Mappatura dei domini Numero massimo di certificati SSL 50 No per dominio principale e per settimana
Mappatura dei domini Numero massimo di certificati SSL duplicati 5 No per dominio principale e per settimana
Token di accesso Numero massimo di token di accesso univoci generati 50 No per istanza di container al secondo
Token di identità Numero massimo di token di identità univoci generati 50 No per istanza di container al secondo

1 Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo maximum instance (istanza massima) di una revisione. Una volta concessa l'autorizzazione in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallelism massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.

  3. Controlla le istanze di container totali per l'esecuzione di job in una regione.

2 Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo istanza massima di una revisione utilizzando il traffico in uscita da VPC diretto. Una volta concessa l'autorizzazione in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallelism massimo di un job utilizzando il traffico in uscita da VPC diretto. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.

Limiti di networking per Cloud Run

Limiti delle richieste per Cloud Run

Descrizione Limite Note
Numero massimo di richieste in parallelo per istanza 1000
Numero massimo di stream simultanei per connessione client HTTP/2 100
Tempo massimo prima del timeout per richiesta 60 minuti
Dimensione massima della richiesta HTTP/1 32 MiB se utilizzi un server HTTP/1. Nessun limite se utilizzi il server HTTP/2.
Dimensione massima della risposta HTTP/1 32 MiB se non utilizzi Transfer-Encoding: chunked o meccanismi di streaming
Connessioni in uscita al secondo per istanza 700
Richieste in entrata al secondo su una porta container HTTP/1 per istanza 800 Non si applica alle porte del container HTTP/2.

Limiti di larghezza di banda per Cloud Run

Alle istanze di Cloud Run si applicano i seguenti limiti di larghezza di banda:

Descrizione Limite Note
Byte massimi per istanza 75 megabyte al secondo (MBps) Questo limite si basa sulla somma dei byte in entrata e in uscita, escluso il traffico in uscita dal VPC diretto verso le destinazioni sulla rete VPC.
Frequenza totale massima di pacchetti per istanza 64.000 pacchetti al secondo Questo limite si basa sulla somma dei pacchetti in entrata e in uscita, escluso il traffico in uscita dal VPC diretto verso le destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura all'API Cloud Run Admin Il numero di letture dell'API ogni 60 secondi per regione. Non riguarda il numero di richieste di lettura ai tuoi servizi Cloud Run, per cui non ci sono limitazioni. 3000 ogni 60 secondi per progetto e regione
Richieste di scrittura all'API Cloud Run Admin Il numero di scritture dell'API ogni 60 secondi per regione. Non riguarda il numero di richieste di scrittura ai tuoi servizi Cloud Run, per cui non ci sono limitazioni. 180 ogni 60 secondi per progetto e regione
Esecuzione job Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. 180 ogni 60 secondi per progetto e regione

Come aumentare la quota

Per richiedere un valore di quota più elevato utilizzando la console Google Cloud:

  1. Vai alla pagina Quote:

    Vai a Quote

    I passaggi rimanenti verranno visualizzati automaticamente nella console Google Cloud.

  2. Nella pagina Quote, individua la quota che vuoi aumentare nella colonna Quota.

    Puoi utilizzare la casella di ricerca Filtro per cercare la quota.

  3. Seleziona la casella di controllo a sinistra della quota.

  4. Fai clic su MODIFICA QUOTE. Viene visualizzato il modulo Modifiche alla quota.

  5. Nel modulo Modifiche alla quota, inserisci nel campo Nuovo limite la quota aumentata che vuoi per il tuo progetto.

  6. Compila eventuali campi aggiuntivi nel modulo, poi fai clic su FINE.

  7. Fai clic su INVIA RICHIESTA.

Sebbene la procedura descritta in precedenza si applichi alla maggior parte delle richieste di aumento della quota, potresti incorrere in una delle seguenti eccezioni:

  • Nel caso in cui ci sia un limite di utilizzo esistente, quest'ultimo deve essere rimosso prima di poter aumentare la quota. Ti verrà presentata un'informativa e un contratto. L'informativa indica che il limite di utilizzo verrà eliminato e che il limite verrà aggiornato immediatamente al limite predefinito. La tua richiesta di aumento della quota verrà quindi elaborata da Google Cloud normalmente.
  • A volte la console Google Cloud ti reindirizza a un modulo separato per richiedere un aumento del limite. Dopo aver inviato il modulo, Google Cloud conferma la tua richiesta via email.
  • Alcune quote non possono essere aggiornate utilizzando la console Google Cloud. Se non riesci a modificare una quota dalla console, richiedi l'aumento all'assistenza clienti Google Cloud. Il team di fatturazione non gestisce l'aumento del limite di quota.

Google consiglia di creare una richiesta di aumento della quota diversa per ogni classe di risorse. Ad esempio, devi separare gli aumenti della quota di rete per progetto da quelli non di rete di Compute Engine. Se vengono combinate classi di richieste diverse, una richiesta di aumento può ritardare il batch se la sua approvazione richiede più tempo per la valutazione.

Se la richiesta di aumento della quota richiede l'approvazione, riceverai un'email da Google Cloud che conferma la tua richiesta. Se hai bisogno di ulteriore assistenza, puoi rispondere all'email. L'assistenza clienti Google Cloud in genere elabora la richiesta entro 2-3 giorni lavorativi. L'assistenza clienti Google Cloud ti invia quindi una seconda email con cui ti viene comunicato se l'aumento di quota è stato approvato o negato. L'email fornisce la data di validità dell'aumento, se applicabile.

Per saperne di più su come funziona il processo di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.