Cloud Run ti addebita solo i costi delle risorse utilizzate, arrotondati per eccesso ai 100 millisecondi più vicini. Il totale della fattura di Cloud Run sarà la somma dell'utilizzo delle risorse nella tabella dei prezzi dopo l'applicazione del livello gratuito.
Quando si imposta una contemporaneità superiore a una richiesta alla volta, più richieste possono condividere la CPU e la memoria allocate per un'istanza.
Il trasferimento di dati internet in uscita utilizza il livello Premium di Network Service Tiers e viene addebitato in base ai prezzi di networking di Google Cloud con un livello gratuito di 1 GiB di trasferimento di dati gratuito all'interno del Nord America al mese.
Il trasferimento di dati alle reti Virtual Private Cloud viene fatturato come trasferimento di dati da una VM e addebitato alle tariffe di trasferimento dati di Virtual Private Cloud. I connettori di accesso VPC serverless addebitano anche i costi di calcolo necessari per eseguirli. Consulta i prezzi di accesso VPC serverless.
Non viene addebitato alcun costo per il trasferimento di dati alle risorse Google Cloud nella stessa regione (ad esempio per il traffico da un servizio Cloud Run a un altro servizio Cloud Run). Non sono previsti addebiti per il trasferimento di dati a Media CDN, Cloud CDN e Cloud Load Balancing.
Quando valuti i prezzi di Cloud Run, tieni presente quanto segue:
Scopri di più sull'ottimizzazione dei costi.
Calcolatore prezzi
Puoi utilizzare il Calcolatore prezzi di Google Cloud per stimare il costo di utilizzo di Cloud Run.
Le seguenti tabelle dei prezzi utilizzano l'unità GiB/secondo. Un GiB/secondo indica, ad esempio, l'esecuzione di un'istanza da 1 gibibyte per 1 secondo o l'esecuzione di un'istanza da 256 mebibyte per 4 secondi. Lo stesso principio si applica per l'unità vCPU/secondo. CUD fa riferimento agli sconti per impegno di utilizzo.
L'utilizzo del livello gratuito viene aggregato nei vari progetti per account di fatturazione e viene ripristinato ogni mese. Ti viene addebitato solo l'utilizzo oltre il livello gratuito. Il livello gratuito viene applicato come uno sconto basato sulla spesa utilizzando i prezzi del Livello 1.
I prezzi di Cloud Run dipendono dalla regione selezionata. I prezzi dei servizi Cloud Run dipendono anche dalla configurazione di fatturazione.
Se la valuta utilizzata per il pagamento è diversa dai dollari statunitensi, si applicano i prezzi nella tua valuta elencati negli SKU Cloud Platform.
Servizi (fatturazione basata su istanza)
Servizi con fatturazione basata su istanze
Livello gratuito (in base ai prezzi di us-central1):
Risorsa | Default* (USD) | Cloud Run CUD - 1 Year* (USD) | Cloud Run CUD - 3 Year* (USD) | Compute Flexible CUD - 1 Year* (USD) | Compute Flexible CUD - 3 Year* (USD) |
---|---|---|---|---|---|
CPU (per vCPU al secondo) | 0,000018 USD | 0,00001494 USD | 0,00001494 USD | 0,00001296 USD | 0,00000972 USD |
Memoria (per GiB-secondo) | 0,000002 USD | 0,00000166 USD | 0,00000166 USD | 0,00000144 USD | 0,00000108 USD |
Tipo di GPU NVIDIA-L4 Nessuna ridondanza a livello di zona (al secondo) | 0,0001867 USD | - | - | - | - |
Tipo di GPU NVIDIA-L4 Ridondanza zonale (al secondo) | 0,0002909 USD | - | - | - | - |
Gli sconti per impegno di utilizzo di Cloud Run si applicano solo alle risorse Cloud Run. Per una maggiore flessibilità, utilizza i CUD flessibili di Compute.
CUD flessibile fa riferimento agli sconti per impegno di utilizzo flessibili di Compute.
Servizi (fatturazione basata su richieste)
Servizi con fatturazione basata su richieste durante il tempo di istanza fatturata
Livello gratuito (in base ai prezzi attivi di us-central1):
Risorsa | Tipo | Default* (USD) | Cloud Run CUD - 1 Year* (USD) | Cloud Run CUD - 3 Year* (USD) | Compute Flexible CUD - 1 Year* (USD) | Compute Flexible CUD - 3 Year* (USD) |
---|---|---|---|---|---|---|
CPU (per vCPU al secondo) | Tempo di attività | 0,000024 USD | 0,00001992 USD | 0,00001992 USD | 0,00001992 USD | 0,00001992 USD |
Tempo di inattività (istanza minima1) | 0,0000025 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD | |
Memoria (per GiB-secondo) | Tempo di attività | 0,0000025 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD |
Tempo di inattività (istanza minima1) | 0,0000025 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD | 0,000002075 USD | |
Richieste (per 1.000.000) | N/A | 0,40 USD | 0,332 USD | 0,332 USD | 0,332 USD | 0,332 USD |
1 istanza minima inattiva si riferisce al tempo di inattività fatturabile per le istanze mantenute in uso utilizzando istanze minime. Le istanze inattive che non sono istanze minime non vengono addebitate.
Le richieste vengono fatturate solo quando raggiungono il container dopo essere state autenticate; le richieste rifiutate dal criterio IAM non vengono fatturate.
Gli sconti per impegno di utilizzo di Cloud Run si applicano solo alle risorse Cloud Run. Per una maggiore flessibilità, utilizza i CUD flessibili di Compute.
CUD fa riferimento agli sconti per impegno di utilizzo.
Job
Livello gratuito (in base ai prezzi di us-central1):
Risorsa | Default* (USD) | Cloud Run CUD - 1 Year* (USD) | Cloud Run CUD - 3 Year* (USD) | Compute Flexible CUD - 1 Year* (USD) | Compute Flexible CUD - 3 Year* (USD) |
---|---|---|---|---|---|
CPU (per vCPU al secondo) | 0,000018 USD | 0,00001494 USD | 0,00001494 USD | 0,00001296 USD | 0,00000972 USD |
Memoria (per GiB-secondo) | 0,000002 USD | 0,00000166 USD | 0,00000166 USD | 0,00000144 USD | 0,00000108 USD |
Tipo di GPU NVIDIA-L4 Nessuna ridondanza a livello di zona (al secondo) | 0,0001867 USD | - | - | - | - |
Tipo di GPU NVIDIA-L4 Ridondanza zonale (al secondo) | 0,0002909 USD | - | - | - | - |
Gli sconti per impegno di utilizzo di Cloud Run si applicano solo alle risorse Cloud Run. Per una maggiore flessibilità, utilizza i CUD flessibili di Compute.
CUD flessibile fa riferimento agli sconti per impegno di utilizzo flessibili di Compute.
Pool di worker
Livello gratuito (in base ai prezzi di us-central1):
Risorsa | Default* (USD) | Compute Flexible CUD - 1 Year* (USD) | Compute Flexible CUD - 3 Year* (USD) |
---|---|---|---|
CPU (per vCPU al secondo) | 0,000011244 USD | 0,000008096 USD | 0,000006072 USD |
Memoria (per GiB-secondo) | 0,000001235 USD | 0,000000889 USD | 0,000000667 USD |
Se la valuta utilizzata per il pagamento è diversa dai dollari statunitensi, si applicano i prezzi nella tua valuta elencati negli SKU Cloud Platform.
CUD flessibile fa riferimento agli sconti per impegno di utilizzo flessibili di Compute.
Soggetto ai prezzi di Livello 1
Soggetto ai prezzi di Livello 2
Il tempo fatturabile aggregato per tutte le istanze di Cloud Run viene mostrato come metrica di Cloud Monitoring. Per ulteriori dettagli, consulta la metrica container/billable_instance_time.
Il tempo di istanza fatturabile viene arrotondato per eccesso ai 100 millisecondi più vicini e dipende dalla configurazione di fatturazione del servizio Cloud Run:
Tempo di istanza fatturabile per i servizi con fatturazione basata su richieste
Per impostazione predefinita, Cloud Run addebita solo i costi di CPU e memoria allocate a un'istanza quando:
Se imposti un numero minimo di istanze, ti verrà addebitata anche una tariffa di "inattività" per il tempo in cui queste istanze non elaborano richieste. Consulta la tabella in alto.
Tempo di istanza fatturabile per i servizi con fatturazione basata su istanza
Se attivi l'opzione Fatturazione basata su istanza, ti viene addebitata l'intera durata di qualsiasi istanza di container Cloud Run: dall'avvio all'interruzione del container, con un minimo di un minuto.
Tempo di istanza fatturabile per i job Cloud Run
I job Cloud Run vengono fatturati alla tariffa di fatturazione basata sulle istanze per l'intera durata di qualsiasi istanza avviata, con un minimo di 1 minuto.
Esempio 1: API pubblica/sito web - Accesso ai dati di un'applicazione esterna
Supponiamo di aver eseguito il deployment di un servizio Cloud Run con fatturazione basata sulle richieste in europe-west1 (Belgio) per gestire siti web, app web, API o backend mobili. Il tuo servizio riceve 10 milioni di richieste al mese con una latenza media per richiesta di 400 millisecondi. Questo servizio è configurato con 1 vCPU, 512 MiB di memoria e 20 richieste simultanee massime per istanza. Il pattern di traffico segue un ciclo di 24 ore, con un volume di richieste che fluttua su 12 ore in una distribuzione a campana.
Il costo mensile stimato per questo carico di lavoro è di 13,69 $. Senza il livello gratuito vCPU/memoria, il costo sarebbe di 18,91 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
Esempio 2: Concorrenza singola - App a uso intensivo di CPU/non thread-safe, una richiesta per istanza
Supponiamo di aver eseguito il deployment di un servizio Cloud Run in europe-west1 (Belgio) utilizzando la fatturazione basata su richiesta per un'applicazione a uso intensivo di CPU, non thread-safe, che elabora una richiesta alla volta. Il tuo servizio riceve 10 milioni di richieste al mese con una latenza media per richiesta di 400 millisecondi. Questo servizio è configurato con 1 vCPU e 512 MiB di memoria.
Il costo mensile stimato per questo carico di lavoro è di 81,72 $. Senza il livello gratuito vCPU/memoria, il costo sarebbe di 86,49 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
Esempio 3: Endpoint di inferenza AI - Distribuzione di modelli locali con Ollama
Supponiamo di aver eseguito il deployment di un servizio Cloud Run in europe-west1 (Belgio) per gestire LLM o generazione di immagini in tempo reale con accelerazione GPU. Questo servizio è configurato con 4 vCPU, 16 GiB di memoria e NVIDIA-L4 (nessuna ridondanza zonale). Questo servizio raggiunge un picco giornaliero di 2 istanze e il pattern di traffico segue un ciclo di 24 ore, con un volume di richieste che fluttua su 12 ore in una distribuzione a campana.
Il costo mensile stimato per questo carico di lavoro è di 822,40 $. Senza il livello gratuito vCPU/memoria, il costo sarebbe di 827,62 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
Esempio 4: Funzione serverless - FaaS leggero per il ridimensionamento delle immagini al momento del caricamento
Supponiamo di aver eseguito il deployment di un servizio Cloud Run con fatturazione basata sulle richieste in europe-west1 (Belgio) per gestire l'esecuzione di codice basata su eventi (ad esempio, caricamento di file, richiesta HTTP). Il tuo servizio riceve 10 milioni di richieste al mese con una latenza media per richiesta di 200 millisecondi. Questo servizio è configurato con 0,167 vCPU, 256 MiB di memoria e 1 richiesta simultanea massima per istanza.
Il costo mensile stimato per questo carico di lavoro è di 7,25 $. Senza il livello gratuito vCPU/memoria, il costo sarebbe di 12,47 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
Esempio 5: Elaborazione di job batch - Trasformazioni di dati su larga scala e pianificate
Supponiamo di aver eseguito il deployment di un job Cloud Run in europe-west1 (Belgio) per elaborare trasformazioni di dati su larga scala pianificate (ad es. report). Il tuo job viene avviato una volta all'ora (730 al mese) e ogni esecuzione dura 1 minuto. Questo job è configurato con 1 vCPU, 512 MiB di memoria e 1 attività per esecuzione.
Il costo mensile stimato per questo carico di lavoro è di 0,00 $. Senza il livello gratuito vCPU/Memoria, il costo sarebbe di 0,45 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
Esempio 6: Worker in background - Offload asincrono di operazioni intensive
Supponiamo di aver eseguito il deployment di un pool di worker Cloud Run in europe-west1 (Belgio) per scaricare attività pesanti o di lunga durata (ad esempio, email in blocco, elaborazione video) per mantenere reattiva l'applicazione principale. Il tuo pool di worker è configurato per eseguire una singola istanza per un intero mese. Questo pool di worker è configurato con 1 vCPU e 512 MiB di memoria.
Il costo mensile stimato per questo carico di lavoro è di 11,61 $. Senza il livello gratuito vCPU/memoria, il costo sarebbe di 16,83 $.
Per comprendere questi calcoli in dettaglio e per regolare le impostazioni e le stime di utilizzo, usa il Calcolatore prezzi.
I deployment da origine e le funzioni Cloud Run funzionano come servizi Cloud Run e vengono fatturati di conseguenza in base alle condizioni sopra riportate.
Quando esegui il deployment da origine o crei una funzione, Cloud Run utilizza Cloud Build per convertire il codice sorgente o la funzione in un'immagine eseguibile. Le immagini vengono create in Cloud Build e archiviate in Artifact Registry. Artifact Registry ha un proprio Livello gratuito per l'archiviazione. Se esegui il deployment del codice sorgente o della funzione in Artifact Registry e superi l'utilizzo del Livello gratuito di Artifact Registry, ti verranno addebitati dei costi per il deployment delle funzioni, anche quando l'utilizzo di Cloud Run rientra nel Livello gratuito.
I prezzi di Cloud Build e Artifact Registry non sono inclusi nei prezzi di Cloud Run. Per esaminare i prezzi di questi servizi, consulta le pagine Prezzi di Cloud Build e Prezzi di Artifact Registry.
Cloud Run utilizza Eventarc per la distribuzione degli eventi. I prezzi di Eventarc non sono inclusi nei prezzi di Cloud Run riportati sopra. Rivedi i prezzi nella pagina Prezzi di Eventarc.
I prezzi delle funzioni Cloud Run (1ª gen.) non sono inclusi nei prezzi di Cloud Run. Esamina i prezzi in Prezzi di Cloud Run Functions (1ª gen.).