Questa pagina è stata tradotta dall'API Cloud Translation.

Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

Le dimensioni delle immagini container di cui puoi eseguire il deployment.
Il numero di richieste in parallelo gestite da un servizio Cloud Run.

Limiti di risorse per Cloud Run

Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per superare i limiti per progetto che non possono essere aumentati, crea nuove risorse in un Google Cloud progetto o una regione diversa.

Risorsa	Ambito	Descrizione	Limite	Aumentabile
Servizio	per progetto e regione	Numero massimo di servizi	1000	No
Job	per progetto e regione	Numero massimo di job	1000	No
Esecuzione del job	per progetto e regione	Numero massimo di esecuzioni di job in esecuzione	1000	No
Revisione	per servizio	Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico	1000	No
Revisione	per progetto e regione	Numero massimo di revisioni che gestiscono il traffico	4000	No
Tag di revisione	per progetto e regione	Numero massimo di tag di revisione. Quando il limite di tag di revisione viene superato, Cloud Run esegue la pulizia dei tag nel servizio. Per il servizio per cui viene creato un nuovo tag, i tag che non hanno una percentuale di traffico specificata vengono eliminati automaticamente in ordine cronologico.	2000	No
Esecuzione del job	per job	Limite di conservazione per le esecuzioni dei job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico	1000	No
Attività di esecuzione del job¹	per esecuzione del job	Numero massimo di attività in esecuzione in parallelo	Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere superiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.	Sì
Attività di esecuzione del job	per esecuzione del job	Valore del timeout massimo delle attività	168 ore (7 giorni)²	No
Attività di esecuzione del job	per esecuzione del job	Numero massimo di attività in un singolo job	10.000	No
Attività di esecuzione del job	per esecuzione del job	Numero massimo di nuovi tentativi di attività in un job	10	No
Variabili di ambiente	per job o per servizio	Numero massimo di variabili di ambiente per ogni contenitore	1000	No
Argomenti comando	per job o per servizio	Numero massimo di argomenti di comando per ogni contenitore	1000	No
Istanza di container¹	per revisione	Numero massimo di istanze di container	Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere superiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.	Sì
Istanza di container¹	per progetto e regione	Numero massimo di istanze di container di tutte le esecuzioni del job in esecuzione	Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere superiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.	Sì
Istanza di container³	per revisione e regione	Numero massimo di istanze di container che utilizzano l'uscita VPC diretta	100-200, a seconda delle configurazioni delle regioni selezionate.	Sì
Istanza di container	per istanza di container	Timeout di avvio, in minuti	4	No
Memoria	per istanza di container	Dimensioni massime della memoria, in GiB	32	No
CPU	per istanza di container	Numero massimo di vCPU	8	No
CPU	per progetto e regione	CPU totale massima, in milli vCPU, allocata a tutte le istanze in un periodo di 1 minuto.	Dipende dalla regione selezionata. Questo limite potrebbe essere superiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.	Sì
Memoria	per progetto e regione	Memoria totale massima, in byte, allocata a tutte le istanze in un periodo di 1 minuto.	Dipende dalla regione selezionata. Questo limite potrebbe essere superiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.	Sì
Istanza GPU⁴	per progetto per regione	Numero massimo di istanze di container con GPU	0⁴	Sì
Disco	per istanza di container	Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GB	32	No
Variabile di ambiente	per variabile	Lunghezza variabile massima, in kB	32	No
Mappatura dei domini	per dominio principale e per settimana	Numero massimo di certificati SSL	50	No
Mappatura dei domini	per dominio principale e per settimana	Numero massimo di certificati SSL duplicati	5	No
Token di accesso	per istanza di container al secondo	Numero massimo di token di accesso univoci generati	50	No
Token di identità	per istanza di container al secondo	Numero massimo di token di identità univoci generati	50	No
File aperti	per istanza di container	Numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a `/proc/sys/fs/file-max`.	25000	No

¹Questa quota regionale viene utilizzata in alcuni casi:

Controlla il valore massimo che può essere scelto per l'attributo Istanza massima di una revisione. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

Controlla il parallismo massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.

Controlla le istanze container totali per l'esecuzione di job in una regione.

²Il supporto per i timeout superiori alle 24 ore è disponibile in Anteprima.

³Questa quota regionale viene utilizzata in alcuni casi:

Controlla il valore massimo che può essere scelto per l'attributo Istanze massime di una revisione che utilizza l'egress VPC diretto. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

Controlla il parallismo massimo di un job che utilizza l'uscita VPC diretta. Una volta concesso in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

⁴ Per accedere alla GPU, devi richiedere un aumento della quota per Total Nvidia L4 GPU allocation, per project per region. Se il picco di utilizzo della GPU non è vicino alla tua quota, Google potrebbe ridurla.

Limiti di rete per Cloud Run

Limiti per le richieste per Cloud Run

Descrizione	Limite	Note
Numero massimo di richieste in parallelo per istanza	1000
Numero massimo di flussi simultanei per connessione client HTTP/2	100
Tempo massimo prima del timeout per richiesta	60 minuti
Dimensione massima della richiesta HTTP/1	32 MiB se utilizzi un server HTTP/1. Nessun limite se utilizzi un server HTTP/2.
Dimensione massima della risposta HTTP/1	32 MiB se non utilizzi `Transfer-Encoding: chunked` o i meccanismi di streaming
Connessioni in uscita al secondo per istanza	700
Risoluzioni DNS in uscita al secondo per istanza	1000
Richieste in entrata al secondo per una porta del container HTTP/1 per istanza	800	Non si applica alle porte dei contenitori HTTP/2.

Limiti di larghezza di banda per Cloud Run

I seguenti limiti di larghezza di banda si applicano alle istanze Cloud Run:

Descrizione	Limite	Note
Bit massimi per istanza per l'uscita tramite VPC diretto	1 Gbps	Uscita tramite VPC diretto in uscita verso destinazioni sulla rete VPC.
Bit massimi per istanza, esclusa l'uscita tramite VPC diretto	600 Mbps	In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso destinazioni nella rete VPC.
Quantità massima totale di pacchetti per istanza, esclusa l'uscita tramite VPC diretto	64.000 pacchetti al secondo	In base alla somma dei pacchetti in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretta verso destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota	Descrizione	Limite	Aumentabile	Ambito
Richieste di lettura dell'API Cloud Run Admin	Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti.	3000 per 60 secondi	Sì	per progetto e regione
Richieste di scrittura all'API Cloud Run Admin	Il numero di scritture dell'API ogni 60 secondi per regione. Non riguarda il numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti.	180 per 60 secondi	Sì	per progetto e regione
Esecuzione del job	Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione.	180 per 60 secondi	Sì	per progetto e regione

Come aumentare la quota

Per modificare un valore di quota:

Nella console Google Cloud, vai alla pagina Quote e limiti di sistema:
Vai a Quote e Limiti di sistema
Individua il valore della quota che vuoi aggiornare nella colonna Quota e seleziona la casella di controllo accanto alla quota che vuoi aggiornare.

Se necessario, utilizza la casella di ricerca Filtra per cercare la quota.
Fai clic su Modifica e viene visualizzata la finestra di dialogo Modifiche alla quota.
Inserisci il valore della quota che preferisci nel campo Nuovo valore. Alcuni valori di quota hanno un'unità di misura. In questo caso, seleziona l'unità che preferisci nell'elenco adiacente. Fai clic su Fine.
(Facoltativo) Se vedi una casella di controllo con il testo I understand that this request will remove any overrides, significa che se imposti il valore della quota su un numero uguale o superiore a quello predefinito, l'override della quota precedente verrà rimosso. Se questo è ciò che vuoi, seleziona la casella di controllo e procedi.
Per aumentare il valore della quota oltre il numero indicato nella finestra di dialogo, seleziona Richiedi una quota più alta.
1. Nel modulo Modifiche alla quota, inserisci il valore della quota aggiornato che vuoi nel campo Nuovo valore. Se viene visualizzato un campo Descrizione della richiesta, inserisci una descrizione. Fai clic su Fine.
2. Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila i dati di contatto nella schermata successiva.
Fai clic su Invia richiesta.

Se non riesci a richiedere un adeguamento dalla console, richiedi l'aumento all'assistenza clienti Google Cloud.

Le richieste di adeguamento delle quote cloud sono soggette a revisione. Se la richiesta di adeguamento della quota richiede la revisione, riceverai un'email di conferma della ricezione della richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo aver esaminato la richiesta, riceverai una notifica via email indicante se la richiesta è stata approvata.

Per scoprire di più su come funziona la procedura di aumento della quota, vedi Informazioni sulle richieste di aumento della quota.

Creazione di richieste batch per valori di quota più elevati

Puoi creare richieste batch per una quota più alta selezionando la casella di controllo accanto a ogni quota da includere. Tuttavia, la creazione di richieste batch può aumentare il tempo necessario a Google Cloud per esaminare la tua richiesta.

Per ridurre i tempi di revisione, raggruppa le richieste di adeguamento della quota per prodotto e area. Ad esempio, se vuoi richiedere adeguamenti alle quote di networking e di VM di Compute Engine, crea una richiesta per le quote di networking e un'altra per le quote di VM di Compute Engine.