Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste in parallelo pubblicate da un servizio Cloud Run.

Limiti delle risorse per Cloud Run

Risorsa Descrizione Limite Aumentabile Ambito
Servizio Numero massimo di servizi 1000 No per progetto e regione
Job Numero massimo di job 1000 No per progetto e regione
Revisione Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 No per servizio
Revisione Numero massimo di revisioni che gestiscono il traffico 4000 No per progetto e regione
Tag di revisione Numero massimo di tag di revisione 2000 No per progetto e regione
Esecuzione del job Limite di conservazione per le esecuzioni del job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine storico 1000 No per job
Attività di esecuzione del job1 Numero massimo di attività in esecuzione in parallelo 200 quando utilizzi 1 CPU e 2 GiB di memoria, dipende dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle aree geografiche aperte di recente. per esecuzione del job
Attività di esecuzione del job Valore massimo di timeout delle attività 1 ora No per esecuzione del job
Attività di esecuzione del job Numero massimo di attività in un singolo job 10.000 No per esecuzione del job
Attività di esecuzione del job Numero massimo di nuovi tentativi di attività in un job 10 No per esecuzione del job
Istanza container1 Numero massimo di istanze di container Dipende dalle configurazioni di CPU e memoria selezionate per regione. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle aree geografiche aperte di recente. per revisione
Istanza container1 Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione 200 quando utilizzi 1 CPU e 2 GiB di memoria, dipende dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle aree geografiche aperte di recente. per progetto e regione
Istanza di container Timeout di avvio, in minuti 4 No per istanza di container
Istanza di container Connessioni in uscita al secondo 700 No per istanza di container
Istanza di container Richieste in entrata al secondo a una porta container HTTP/1 (non si applica alle porte container HTTP/2) 800 No per istanza di container
Memoria Dimensioni massime della memoria, in GiB 32 No per istanza di container
CPU Numero massimo di vCPU 8 No per istanza di container
disco Numero massimo di file system in memoria scrivibili, limitati dalla memoria delle istanze, in GiB 32 No per istanza di container
Variabile di ambiente Lunghezza variabile massima, in kB 32 No per variabile
Richiesta Numero massimo di richieste in parallelo 1000 No per istanza di container
Richiesta Numero massimo di flussi di dati in parallelo 100 No per connessione client HTTP/2
Richiesta Tempo massimo prima del timeout, in minuti 60 No per richiesta
Richiesta Dimensione massima della richiesta HTTP/1, in MiB 32 se utilizzi un server HTTP/1. Nessun limite se utilizzi un server HTTP/2. No per richiesta
Risposta Dimensione massima della risposta HTTP/1, in MiB 32 se non utilizzi Transfer-Encoding: chunked o meccanismi di streaming No per risposta
Mappatura dei domini Numero massimo di certificati SSL 50 No per dominio principale e per settimana
Mappatura dei domini Numero massimo di certificati SSL duplicati 5 No per dominio principale e per settimana
Token di accesso Numero massimo di token di accesso univoci generati 50 No per istanza di container al secondo
Token di identità Numero massimo di token di identità univoci generati 50 No per istanza di container al secondo

1 Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo numero massimo di istanze di una revisione. Una volta concesse in una determinata area geografica, tutte le revisioni al suo interno possono raggiungere il limite concesso.

  2. Controlla il parallelismo massimo di un job. Una volta concessi in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

  3. Controlla le istanze container totali per l'esecuzione dei job in una regione.

NOTA: quando questa quota viene utilizzata per i job, viene suddivisa per 5.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura all'API Cloud Run Admin Il numero di letture API ogni 60 secondi per progetto. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. 1200 ogni 60 secondi Regionale
Richieste di scrittura all'API Cloud Run Admin Il numero di scritture dell'API per 60 secondi per progetto. Non riguarda il numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. 60 ogni 60 secondi Regionale
Esecuzione del job Numero massimo di esecuzioni di un job al minuto per regione 10 per progetto e regione

Come aumentare la quota

Per aumentare le quote oltre i valori predefiniti elencati in questa pagina:

  1. Vai alla pagina Quote di Cloud Run.

  2. Seleziona le quote da modificare per le regioni applicabili e fai clic su MODIFICA QUOTE.

  3. Se richiesto, fornisci le tue informazioni utente e inserisci il nuovo limite per ogni quota selezionata.

La tua richiesta verrà inoltrata al team di assistenza per garantire che Cloud Run possa gestire il tuo caso d'uso nella regione selezionata. È possibile che ti venga chiesto di fornire dettagli sulla configurazione e sui modelli di traffico previsti prima che la richiesta venga accolta. L'elaborazione di richieste di aumento consistenti può richiedere del tempo.