Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.
Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.
Non è previsto un limite diretto per:
- Le dimensioni delle immagini container di cui puoi eseguire il deployment.
- Il numero di richieste in parallelo gestite da un servizio Cloud Run.
Limiti di risorse per Cloud Run
Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per superare i limiti per progetto che non possono essere aumentati, crea nuove risorse in un progetto o in una regione Google Cloud diverso.
Risorsa | Ambito | Descrizione | Limite | Aumentabile |
---|---|---|---|---|
Servizio | per progetto e regione | Numero massimo di servizi | 1000 | No |
Job | per progetto e regione | Numero massimo di job | 1000 | No |
Esecuzione del job | per progetto e regione | Numero massimo di esecuzioni di job in esecuzione | 1000 | No |
Revisione | per servizio | Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico | 1000 | No |
Revisione | per progetto e regione | Numero massimo di revisioni che gestiscono il traffico | 4000 | No |
Tag di revisione | per progetto e regione | Numero massimo di tag di revisione. Quando il limite di tag di revisione viene superato, Cloud Run esegue la pulizia dei tag nel servizio. Per il servizio per cui viene creato un nuovo tag, i tag che non hanno una percentuale di traffico specificata vengono eliminati automaticamente in ordine cronologico. | 2000 | No |
Esecuzione del job | per job | Limite di conservazione per le esecuzioni dei job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico | 1000 | No |
Attività di esecuzione del job1 | per esecuzione del job | Numero massimo di attività in esecuzione in parallelo | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Attività di esecuzione del job | per esecuzione del job | Valore del timeout massimo delle attività | 168 ore (7 giorni)2 | No |
Attività di esecuzione del job | per esecuzione del job | Numero massimo di attività in un singolo job | 10.000 | No |
Attività di esecuzione del job | per esecuzione del job | Numero massimo di nuovi tentativi di attività in un job | 10 | No |
Variabili di ambiente | per job o per servizio | Numero massimo di variabili di ambiente per ogni contenitore | 1000 | No |
Argomenti comando | per job o per servizio | Numero massimo di argomenti di comando per ogni contenitore | 1000 | No |
Istanza di container1 | per revisione | Numero massimo di istanze di container | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza di container1 | per progetto e regione | Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza di container3 | per revisione e regione | Numero massimo di istanze di container che utilizzano l'uscita VPC diretta | 100-200, a seconda delle configurazioni delle regioni selezionate. | Sì |
Istanza di container | per istanza di container | Timeout di avvio, in minuti | 4 | No |
Memoria | per istanza di container | Dimensioni massime della memoria, in GiB | 32 | No |
CPU | per istanza di container | Numero massimo di vCPU | 8 | No |
CPU | per progetto e regione | CPU totale massima, in milli vCPU, allocata a tutte le istanze in un periodo di 1 minuto. | Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Memoria | per progetto e regione | Memoria totale massima, in byte, allocata a tutte le istanze in un periodo di 1 minuto. | Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza GPU4 | per progetto per regione | Numero massimo di istanze di container con GPU | 04 | Sì |
Disco | per istanza di container | Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GB | 32 | No |
Variabile di ambiente | per variabile | Lunghezza variabile massima, in kB | 32 | No |
Mappatura dei domini | per dominio principale e per settimana | Numero massimo di certificati SSL | 50 | No |
Mappatura dei domini | per dominio principale e per settimana | Numero massimo di certificati SSL duplicati | 5 | No |
Token di accesso | per istanza di container al secondo | Numero massimo di token di accesso univoci generati | 50 | No |
Token di identità | per istanza di container al secondo | Numero massimo di token di identità univoci generati | 50 | No |
File aperti | per istanza di container | Numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a /proc/sys/fs/file-max . |
25000 | No |
1Questa quota regionale viene utilizzata in alcuni casi:
Controlla il valore massimo che può essere scelto per l'attributo Istanza massima di una revisione. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.
Controlla il parallismo massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.
Controlla le istanze container totali per l'esecuzione di job in una regione.
2Il supporto per i timeout superiori alle 24 ore è disponibile in Anteprima.
3Questa quota regionale viene utilizzata in alcuni casi:
Controlla il valore massimo che può essere scelto per l'attributo Istanze massime di una revisione che utilizza l'egress VPC diretto. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.
Controlla il parallismo massimo di un job che utilizza l'uscita VPC diretta. Una volta concesso in una determinata regione, tutti i job in quella regione possono raggiungere il limite concesso.
4
Per accedere alla GPU, devi richiedere un aumento della quota per Total Nvidia L4 GPU allocation, per project per region
.
Se il picco di utilizzo della GPU non è vicino alla tua quota, Google potrebbe ridurla.
Limiti di Networking per Cloud Run
Limiti per le richieste per Cloud Run
Descrizione | Limite | Note |
---|---|---|
Numero massimo di richieste in parallelo per istanza | 1000 | |
Numero massimo di flussi simultanei per connessione client HTTP/2 | 100 | |
Tempo massimo prima del timeout per richiesta | 60 minuti | |
Dimensione massima della richiesta HTTP/1 | 32 MiB se utilizzi un server HTTP/1. Nessun limite se utilizzi un server HTTP/2. | |
Dimensione massima della risposta HTTP/1 | 32 MiB se non utilizzi Transfer-Encoding: chunked o i meccanismi di streaming |
|
Connessioni in uscita al secondo per istanza | 700 | |
Risoluzioni DNS in uscita al secondo per istanza | 1000 | |
Richieste in entrata al secondo per una porta del container HTTP/1 per istanza | 800 | Non si applica alle porte dei contenitori HTTP/2. |
Limiti di larghezza di banda per Cloud Run
I seguenti limiti di larghezza di banda si applicano alle istanze Cloud Run:
Descrizione | Limite | Note |
---|---|---|
Bit massimi per istanza per l'uscita tramite VPC diretto | 1 Gbps | Uscita tramite VPC diretto in uscita verso destinazioni sulla rete VPC. |
Bit massimi per istanza, esclusa l'uscita tramite VPC diretto | 600 Mbps | In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso destinazioni nella rete VPC. |
Quantità massima totale di pacchetti per istanza, esclusa l'uscita tramite VPC diretto | 64.000 pacchetti al secondo | In base alla somma dei pacchetti in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretta verso destinazioni sulla rete VPC. |
Se viene raggiunto uno dei due limiti, l'istanza Cloud Run avrà una larghezza di banda limitata.
Limiti di frequenza dell'API Cloud Run Admin
I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.
Quota | Descrizione | Limite | Aumentabile | Ambito |
---|---|---|---|---|
Richieste di lettura dell'API Cloud Run Admin | Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. | 3000 per 60 secondi | Sì | per progetto e regione |
Richieste di scrittura all'API Cloud Run Admin | Il numero di scritture dell'API ogni 60 secondi per regione. Non riguarda il numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. | 180 per 60 secondi | Sì | per progetto e regione |
Esecuzione job | Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. | 180 per 60 secondi | Sì | per progetto e regione |
Come aumentare la quota
Per richiedere un valore di quota più elevato:Vai alla pagina Quote e Limiti di sistema:
Individua la quota che vuoi aumentare nella colonna Quota. Puoi utilizzare la casella di ricerca Filtro per cercare la quota.
Seleziona la casella di controllo accanto alla quota che vuoi aumentare.
Fai clic su
. Viene visualizzata la finestra di dialogo Modifiche alla quota. Modifica (Facoltativo) Se vuoi aumentare il valore della quota oltre il numero indicato sullo schermo, seleziona Richiedi una quota più alta. Compila il modulo, invialo e salta i passaggi rimanenti.
Nel modulo Modifiche alla quota, inserisci la quota aumentata che vuoi nel campo Nuovo valore. Se viene visualizzato un campo Descrizione della richiesta, inserisci una descrizione. Fai clic su Fine.
Se vedi una casella di controllo con il testo "Sono consapevole che questa richiesta rimuoverà eventuali override", il valore della quota è impostato al di sotto del valore predefinito. Se il valore della quota viene impostato su un valore uguale o superiore a quello predefinito, l'override viene rimosso. Per continuare, seleziona la casella di controllo. Scopri di più sugli override della quota.
Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila i dati di contatto nella schermata successiva.
Fai clic su Invia richiesta.
Se non riesci a richiedere un adeguamento dalla console, richiedi l'aumento all'assistenza clienti Google Cloud.
Le richieste di adeguamento delle quote cloud sono soggette a revisione. Se la richiesta di adeguamento della quota richiede la revisione, riceverai un'email di conferma della ricezione della richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo aver esaminato la richiesta, riceverai una notifica via email indicante se la richiesta è stata approvata.
Per scoprire di più su come funziona la procedura di aumento della quota, vedi Informazioni sulle richieste di aumento della quota.
Creazione di richieste batch per valori di quota più elevati
Puoi creare richieste batch per una quota più alta selezionando la casella di controllo accanto a ogni quota da includere. La creazione di richieste batch può aumentare il tempo necessario a Google Cloud per esaminare la tua richiesta. Per ridurre i tempi di revisione, raggruppa le richieste di adeguamento della quota per prodotto e area. Ad esempio, se vuoi richiedere adeguamenti alle quote di networking e di VM di Compute Engine, crea una richiesta per le quote di networking e un'altra per le quote di VM di Compute Engine.