Questa pagina contiene la quota e i limiti di utilizzo che si applicano quando si utilizza Cloud Run.
Il numero di risorse di Cloud Run è limitato. Le quote per Cloud Run comprendono limiti di frequenza API, che influiscono sulla frequenza con cui puoi chiamare l'API Cloud Run Admin.
Non è previsto un limite diretto per:
- Le dimensioni delle immagini container di cui puoi eseguire il deployment.
- Il numero di richieste in parallelo gestite da un servizio Cloud Run.
Limiti di risorse per Cloud Run
Per superare i limiti che possono essere aumentati, richiedi un aumento della quota. Per andare oltre i limiti che non possono essere aumentati per progetto, crea nuove risorse in un progetto Google Cloud o in una regione diversi.
Risorsa | Ambito | Descrizione | Limite | Aumentabile |
---|---|---|---|---|
Servizio | per progetto e regione | Numero massimo di servizi | 1000 | No |
Job | per progetto e regione | Numero massimo di job | 1000 | No |
Esecuzione del job | per progetto e regione | Numero massimo di esecuzioni del job in corso | 1000 | No |
Revisione | per servizio | Numero massimo di revisioni per servizio. Quando si raggiunge il limite, le revisioni che non gestiscono il traffico vengono automaticamente eliminate in ordine cronologico | 1000 | No |
Revisione | per progetto e regione | Numero massimo di revisioni che gestiscono il traffico | 4000 | No |
Tag di revisione | per progetto e regione | Numero massimo di tag di revisione. Quando il numero di tag di revisione raggiunge questo limite, i tag che non hanno una percentuale di traffico vengono eliminati automaticamente in ordine cronologico. | 2000 | No |
Esecuzione del job | per job | Limite di conservazione per le esecuzioni di job completate. Quando il numero di esecuzioni completate per un job raggiunge questo limite, le esecuzioni vengono eliminate automaticamente in ordine cronologico | 1000 | No |
Attività di esecuzione del job1 | per esecuzione del job | Numero massimo di attività in esecuzione in parallelo | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Attività di esecuzione job | per esecuzione del job | Valore di timeout massimo delle attività | 24 ore | No |
Attività di esecuzione del job | esecuzione per job | Numero massimo di attività in un singolo job | 10.000 | No |
Attività di esecuzione del job | esecuzione per job | Numero massimo di nuovi tentativi dell'attività in un job | 10 | No |
Istanza container1 | per revisione | Numero massimo di istanze di container | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza di container1 | per progetto e regione | Numero massimo di istanze di container di tutte le esecuzioni di job in esecuzione | Dipende dalla regione selezionata e dalle configurazioni di CPU e memoria. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza container2 | per revisione e regione | Numero massimo di istanze di container che utilizzano il traffico VPC diretto in uscita | 100-200, a seconda delle configurazioni dell'area geografica selezionate. | Sì |
Istanza di container | per istanza di container | Timeout all'avvio, in minuti. | 4 | No |
Memoria | per istanza di container | Dimensioni massime della memoria, in GiB | 32 | No |
CPU | per istanza di container | Numero massimo di vCPU | 8 | No |
CPU | per progetto e regione | CPU totale massima, in milli vCPU, allocata a tutte le istanze in un periodo di 1 minuto. | Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Memoria | per progetto e regione | Memoria totale massima, in byte, allocata a tutte le istanze in un periodo di 1 minuto. | Dipende dalla regione selezionata. Questo limite potrebbe essere maggiore nelle regioni ad alta capacità o inferiore nelle regioni aperte di recente. | Sì |
Istanza GPU3 | per progetto per regione | Numero massimo di istanze di container con GPU | 03 | Sì |
Disco | per istanza di container | Dimensioni massime del filesystem in memoria scrivibile, limitate dalla memoria dell'istanza, in GB | 32 | No |
Variabile di ambiente | per variabile | Lunghezza variabile massima, in kB | 32 | No |
Mappatura dei domini | per dominio principale e per settimana | Numero massimo di certificati SSL | 50 | No |
Mappatura dei domini | per dominio principale e per settimana | Numero massimo di certificati SSL duplicati | 5 | No |
Token di accesso | per istanza di container al secondo | Numero massimo di token di accesso univoci generati | 50 | No |
Token di identità | per istanza di container al secondo | Numero massimo di token di identità univoci generati | 50 | No |
File aperti | per istanza di container | Numero massimo di file che possono essere aperti contemporaneamente. Corrisponde a /proc/sys/fs/file-max . |
25000 | No |
1Questa quota regionale viene utilizzata in alcuni casi:
Controlla il valore massimo che può essere selezionato l'attributo di istanza massima di un revisione. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.
Controlla il parallismo massimo di un job. Una volta concesso in una determinata regione, tutti i job in quella regione possono arrivare fino al limite concesso.
Controlla il numero totale di istanze container per l'esecuzione di job in una regione.
2Questa quota regionale viene utilizzata in alcuni casi:
Controlla il valore massimo che può essere selezionato l'attributo di istanza massima di un revisione utilizzando il VPC diretto in uscita. Una volta concesso in una determinata regione, tutte le revisioni in quella regione possono raggiungere il limite concesso.
Controlla il parallismo massimo di un job che utilizza l'uscita VPC diretta. Una volta concessa in una determinata regione, in quella regione possono fino al limite concesso.
3
Per accedere alla GPU, devi richiedere un aumento delle quote per Total Nvidia L4 GPU allocation, per project per region
.
Limiti di rete per Cloud Run
Limiti per le richieste per Cloud Run
Descrizione | Limite | Note |
---|---|---|
Numero massimo di richieste in parallelo per istanza | 1000 | |
Numero massimo di flussi simultanei per connessione client HTTP/2 | 100 | |
Tempo massimo prima del timeout per richiesta | 60 minuti | |
Dimensione massima della richiesta HTTP/1 | 32 MiB se utilizzi un server HTTP/1. Nessun limite se si utilizza il server HTTP/2. | |
Dimensione massima della risposta HTTP/1 | 32 MiB se non usi Transfer-Encoding: chunked o meccanismi di streaming |
|
Connessioni in uscita al secondo per istanza | 700 | |
Risoluzioni DNS in uscita al secondo per istanza | 1000 | |
Richieste in entrata al secondo verso una porta container HTTP/1 per istanza | 800 | Non si applica alle porte dei contenitori HTTP/2. |
Limiti di larghezza di banda per Cloud Run
Alle istanze Cloud Run si applicano i seguenti limiti di larghezza di banda:
Descrizione | Limite | Note |
---|---|---|
Numero massimo di bit per istanza per il traffico in uscita tramite VPC diretto | 1 Gbps | In uscita verso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC. |
Numero massimo di bit per istanza, escluso il traffico in uscita su VPC diretto | 600 Mbit/s | In base alla somma dei bit in entrata e in uscita, escluso il traffico in uscita tramite l'uscita VPC diretto verso destinazioni nella rete VPC. |
Frequenza totale massima di pacchetti per istanza, escluso il traffico in uscita su VPC diretto | 64.000 pacchetti al secondo | Basato sulla somma dei pacchetti in entrata e dei pacchetti in uscita, escluso il traffico VPC diretto in uscita verso destinazioni sulla rete VPC. |
Se viene raggiunto uno dei due limiti, l'istanza Cloud Run con una larghezza di banda limitata.
Limiti di frequenza dell'API Cloud Run Admin
I seguenti limiti di frequenza si applicano all'API Cloud Run Admin. Non si applicano alle richieste che raggiungono i servizi Cloud Run di cui hai eseguito il deployment.
Quota | Descrizione | Limite | Aumentabile | Ambito |
---|---|---|---|---|
Richieste di lettura all'API Cloud Run Admin | Numero di letture dell'API per 60 secondi per regione. Non riguarda il numero di richieste di lettura ai servizi Cloud Run, per cui non sono previsti limiti. | 3000 ogni 60 secondi | Sì | per progetto e regione |
Richieste di scrittura all'API Cloud Run Admin | Il numero di scritture API ogni 60 secondi per regione. Non si riferisce al numero di richieste di scrittura ai servizi Cloud Run, per cui non sono previsti limiti. | 180 per 60 secondi | Sì | per progetto e regione |
Esecuzione job | Numero massimo di volte in cui un job può essere eseguito ogni 60 secondi per regione. | 180 ogni 60 secondi | Sì | per progetto e regione |
Come aumentare la quota
Per richiedere un valore di quota più elevato:Vai alla pagina Quote e Limiti di sistema:
Individua la quota che vuoi aumentare nella colonna Quota. Puoi utilizzare lo Filtra la casella di ricerca per cercare la tua quota.
Seleziona la casella di controllo accanto alla quota che vuoi aumentare.
Fai clic su
. Viene visualizzata la finestra di dialogo Modifiche alla quota. Modifica (Facoltativo) Se vuoi aumentare il valore della quota oltre il numero indicato Sullo schermo, seleziona Richiedi una quota più alta. Compila il modulo, invialo e salta i passaggi rimanenti.
Nel modulo Modifiche alla quota, inserisci la quota aumentata che vuoi nel campo Nuovo valore. Se viene visualizzato un campo Descrizione richiesta, inserisci una descrizione. Fai clic su Fine.
Se vedi una casella con il testo "Sono consapevole che questa richiesta rimuoverà eventuali sostituzioni", il valore della quota è impostato al di sotto del valore predefinito. La regolazione del valore di quota predefinito o superiore a quello predefinito rimuove l'override. Per continuare, controlla il riquadro. Scopri di più su sostituzioni delle quote.
Se viene visualizzato un pulsante Avanti, fai clic su Avanti e compila il tuo contatto. i dettagli nella schermata che segue.
Fai clic su Invia richiesta.
Se scopri che non è possibile richiedere una modifica dalla console, richiedi di aumento dall'assistenza clienti Google Cloud.
Le richieste di aggiustamento di Cloud Quotas sono soggette a revisione. Se la tua quota la richiesta di aggiustamento deve essere esaminata, ricevi un'email di conferma di ricezione della tua richiesta. Se hai bisogno di ulteriore assistenza, rispondi all'email. Dopo il giorno dopo aver esaminato la richiesta, riceverai una notifica via email che indica se la tua richiesta è stata approvata.
Per saperne di più sul funzionamento del processo di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.
Creazione di batch di richieste per valori di quota più elevati
Puoi raggruppare le richieste di una quota più alta selezionando la casella di controllo accanto a ogni quota da includere. Il raggruppamento delle richieste in batch può aumentare la quantità necessario a Google Cloud per esaminare la tua richiesta. Per ridurre i tempi di revisione, agrupa le richieste di aggiustamento della quota per prodotto e area. Ad esempio, se vuoi richiedere aggiustamenti delle quote di networking e VM di Compute Engine, crearne una una richiesta per le quote di networking e un'altra richiesta per quote delle VM.