Quote e limiti di Cloud Run

Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.

Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.

Non è previsto un limite diretto per:

  • Le dimensioni delle immagini container di cui puoi eseguire il deployment.
  • Il numero di richieste in parallelo gestite da un servizio Cloud Run.

Limiti di risorse per Cloud Run

Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per superare i limiti per progetto che non possono essere aumentati, crea nuove risorse in un altro progetto o in un'altra regione Google Cloud.

Risorsa Ambito Descrizione Limite Aumentabile
Servizio per progetto e regione Numero massimo di servizi 1000 No
Job per progetto e regione Numero massimo di job 1000 No
Esecuzione del job per progetto e regione Numero massimo di esecuzioni di job in esecuzione 1000 No
Revisione per servizio Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico 1000 No
Revisione per progetto e regione Numero massimo di revisioni che gestiscono il traffico 4000 No
Tag di revisione per progetto e regione Numero massimo di tag di revisione. Quando il limite di tag di revisione viene superato, Cloud Run esegue la pulizia dei tag nel servizio. Per il servizio per cui viene creato un nuovo tag, i tag che non hanno una percentuale di traffico specificata vengono eliminati automaticamente in ordine cronologico. 2000 No
Esecuzione del job per job Limite di conservazione per le esecuzioni dei job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico 1000 No
Attività di esecuzione del job1 per esecuzione del job Numero massimo di attività in esecuzione in parallelo Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Attività di esecuzione del job per esecuzione del job Valore del timeout massimo delle attività 168 ore (7 giorni)3 No
Attività di esecuzione del job per esecuzione del job Numero massimo di attività in un singolo job 10.000 No
Attività di esecuzione del job per esecuzione del job Numero massimo di nuovi tentativi di attività in un job 10 No
Variabili di ambiente per job o per servizio Numero massimo di variabili di ambiente per ogni contenitore 1000 No
Argomenti comando per job o per servizio Numero massimo di argomenti di comando per ogni contenitore 1000 No
Istanza di container1 per revisione Numero massimo di istanze di container Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza di container1 per progetto e regione Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza di container2 per revisione e regione Numero massimo di istanze di container che utilizzano l'uscita VPC diretta 100-200, a seconda delle configurazioni delle regioni selezionate.
Istanza di container per istanza di container Timeout di avvio, in minuti 4 No
Memoria per istanza di container Dimensioni massime della memoria, in GiB 32 No
CPU per istanza di container Numero massimo di vCPU 8 No
CPU per progetto e regione CPU totale massima, in milli vCPU, allocata a tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Memoria per progetto e regione Memoria totale massima, in byte, allocata a tutte le istanze in un periodo di 1 minuto. Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente.
Istanza GPU3 per progetto per regione Numero massimo di istanze di container con GPU 03
Disco per istanza di container Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GB 32 No
Variabile di ambiente per variabile Lunghezza variabile massima, in kB 32 No
Mappatura dei domini per dominio principale e per settimana Numero massimo di certificati SSL 50 No
Mappatura dei domini per dominio principale e per settimana Numero massimo di certificati SSL duplicati 5 No
Token di accesso per istanza di container al secondo Numero massimo di token di accesso univoci generati 50 No
Token di identità per istanza di container al secondo Numero massimo di token di identità univoci generati 50 No
File aperti per istanza di container Numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a
/proc/sys/fs/file-max.
25000 No

1Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo Istanza massima di una revisione. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallismo massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.

  3. Controlla il numero totale di istanze container per l'esecuzione di job in una regione.

2Questa quota regionale viene utilizzata in alcuni casi:

  1. Controlla il valore massimo che può essere scelto per l'attributo Istanze massime di una revisione che utilizza l'egress VPC diretto. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.

  2. Controlla il parallismo massimo di un job che utilizza l'uscita VPC diretta. Una volta concesso in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.

3 Per accedere alla GPU, devi richiedere un aumento della quota per Total Nvidia L4 GPU allocation, per project per region.

3Il supporto per i timeout superiori alle 24 ore è disponibile in Anteprima.

Limiti di Networking per Cloud Run

Limiti per le richieste per Cloud Run

Descrizione Limite Note
Numero massimo di richieste in parallelo per istanza 1000
Numero massimo di flussi simultanei per connessione client HTTP/2 100
Tempo massimo prima del timeout per richiesta 60 minuti
Dimensione massima della richiesta HTTP/1 32 MiB se utilizzi un server HTTP/1. Nessun limite se utilizzi un server HTTP/2.
Dimensione massima della risposta HTTP/1 32 MiB se non utilizzi Transfer-Encoding: chunked o i meccanismi di streaming
Connessioni in uscita al secondo per istanza 700
Risoluzioni DNS in uscita al secondo per istanza 1000
Richieste in entrata al secondo per una porta del container HTTP/1 per istanza 800 Non si applica alle porte dei contenitori HTTP/2.

Limiti di larghezza di banda per Cloud Run

I seguenti limiti di larghezza di banda si applicano alle istanze Cloud Run:

Descrizione Limite Note
Bit massimi per istanza per l'uscita tramite VPC diretto 1 Gbps Uscita tramite VPC diretto in uscita verso destinazioni sulla rete VPC.
Bit massimi per istanza, esclusa l'uscita tramite VPC diretto 600 Mbps In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso destinazioni sulla rete VPC.
Quantità massima totale di pacchetti per istanza, esclusa l'uscita tramite VPC diretto 64.000 pacchetti al secondo In base alla somma dei pacchetti in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretta verso destinazioni sulla rete VPC.

Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.

Limiti di frequenza dell'API Cloud Run Admin

I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.

Quota Descrizione Limite Aumentabile Ambito
Richieste di lettura dell'API Cloud Run Admin Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. 3000 per 60 secondi per progetto e regione
Richieste di scrittura all'API Cloud Run Admin Il numero di scritture dell'API ogni 60 secondi per regione. Non riguarda il numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. 180 per 60 secondi per progetto e regione
Esecuzione job Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. 180 per 60 secondi per progetto e regione

Come aumentare la quota

Per richiedere un valore di quota più elevato:

  1. Vai alla pagina Quote e Limiti di sistema:

    Vai a Quote e Limiti di sistema

  2. Individua la quota che vuoi aumentare nella colonna Quota. Puoi utilizzare la casella di ricerca Filtro per cercare la quota.

  3. Seleziona la casella di controllo accanto alla quota che vuoi aumentare.

  4. Fai clic su Modifica. Viene visualizzata la finestra di dialogo Modifiche alla quota.

  5. (Facoltativo) Se vuoi aumentare il valore della quota oltre il numero indicato sullo schermo, seleziona Richiedi una quota più alta. Compila il modulo, invialo e salta i passaggi rimanenti.

  6. Nel modulo Modifiche alla quota, inserisci la quota aumentata che vuoi nel campo Nuovo valore. Se viene visualizzato un campo Descrizione della richiesta, inserisci una descrizione. Fai clic su Fine.

    Se vedi una casella con il testo "Sono consapevole che questa richiesta rimuoverà eventuali override", il valore della quota è impostato al di sotto del valore predefinito. Se il valore della quota viene impostato su un valore uguale o superiore a quello predefinito, l'override viene rimosso. Per continuare, seleziona la casella. Scopri di più sugli override della quota.

    Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila i dati di contatto nella schermata successiva.

  7. Fai clic su Invia richiesta.

Se non riesci a richiedere un adeguamento dalla console, richiedi l'aumento all'assistenza clienti Google Cloud.

Le richieste di adeguamento delle quote cloud sono soggette a revisione. Se la richiesta di adeguamento della quota richiede la revisione, riceverai un'email di conferma della ricezione della richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo aver esaminato la richiesta, riceverai una notifica via email indicante se la richiesta è stata approvata.

Per scoprire di più su come funziona la procedura di aumento della quota, vedi Informazioni sulle richieste di aumento della quota.

Creazione di richieste batch per valori di quota più elevati

Puoi creare richieste batch per una quota più alta selezionando la casella di controllo accanto a ogni quota da includere. La creazione di richieste batch può aumentare il tempo necessario a Google Cloud per esaminare la tua richiesta. Per ridurre i tempi di revisione, raggruppa le richieste di adeguamento della quota per prodotto e area. Ad esempio, se vuoi richiedere adeguamenti alle quote di networking e di VM di Compute Engine, crea una richiesta per le quote di networking e un'altra per le quote di VM di Compute Engine.