Prezzi di Vertex AI

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .

Questa pagina illustra i prezzi per Generative AI su Vertex AI. Per tutti gli altri prezzi di Vertex AI, inclusi i servizi ML Platform e MLOps, consulta la pagina dei prezzi di Vertex AI.

Modelli di base di Google

Multimodale

Con i modelli multimodali in Vertex AI, puoi inserire testo o contenuti multimediali (immagini, video). L'input del testo viene addebitato ogni 1000 caratteri di input (messaggio) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati da punti di codice UTF-8 e gli spazi vuoti vengono esclusi dal conteggio, determinando circa 4 caratteri per token. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo. L'input multimediale viene addebitato in base all'immagine o al secondo (video).

Modello Selezione delle Tipo Prezzo
( =< 128.000 finestra di contesto)
Prezzo
( > finestra di contesto 128.000)
Gemini 1.5 Flash Multimodale Input immagine
Input video
Input testo
Input audio
$0,0001315 / immagine
$0,0001315 / secondo
$0,000125 / 1000 caratteri
$0,0000125 / secondo
$0,000263 / immagine
$0,000263 / secondo
$0,00025 / 1000 caratteri
$0,000025 / secondo
Output testo $0,000375 / 1000 caratteri $0,00075 / 1000 caratteri
Gemini 1.5 Pro Multimodale Input immagine
Input video
Input testo
Input audio
$0,001315 / immagine
$0,001315 / secondo
$0,00125 / 1000 caratteri
$0,000125 / secondo
$0,00263 / immagine
$0,00263 / secondo
$0,0025 / 1000 caratteri
$0,00025 / secondo
Output testo $0,00375 / 1000 caratteri $0,0075 / 1000 caratteri
Gemini 1.0 Pro Multimodale Input immagine
Input video
Input testo
$0,0025 / immagine
$0,002 / secondo
$0,000125 / 1000 caratteri
Output testo $0,000375 / 1000 caratteri
grounding con la Ricerca Google Testo Richieste di grounding 35 $ / 1000 richieste (per un massimo di 1 milione di richieste al giorno).
Contatta il team dedicato al tuo account se hai bisogno di più
di un milione di richieste al giorno.

* I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
* Se un contesto di query è superiore a 128.000, tutti i token vengono addebitati a tariffe di contesto lunghe.
* I modelli Gemini sono disponibili in modalità batch con uno sconto del 50%.
* Gemini 1.0 Pro supporta solo una finestra di contesto fino a 32K.
* I PDF vengono fatturati come input di immagine, con una pagina PDF equivalente a un'immagine

Modello Selezione delle Tipo Prezzo
Gemini 1.5 Pro Multimodale Input immagine
Input video
Input testo
Input audio
$0,00265 / immagine
$0,00265 / secondo
$0,0025 / 1000 caratteri
$0,00025 / secondo
Output testo $0,0075 / 1000 caratteri

Memorizzazione nella cache del contesto

Con la memorizzazione nella cache del contesto, puoi ridurre i costi e la latenza della generazione di contenuti memorizzando nella cache la parte di contesto del testo o dell'elemento multimediale di input nei modelli Gemini. Gli addebiti relativi all'opzione "Archiviazione cache contestuale" sono determinati dalla quantità di tempo in cui i dati vengono archiviati nella cache, che può essere controllata dall'utente. Gli hit della cache per i dati di input vengono addebitati a una tariffa ridotta, "Input memorizzato nella cache", anziché al normale costo di input. Le dimensioni dei dati sia per lo spazio di archiviazione che per l'input vengono calcolate nello stesso modo del prezzo di input di Gemini.

Modello Selezione delle Tipo Prezzo
( =< 128.000 finestra di contesto)
Prezzo per un contesto lungo
( > 128.000 finestra di contesto)
Gemini 1.5 Pro Ingresso
memorizzato nella cache
Input immagine
Input video
Input testo
Input audio
0,0006575 / immagine
0,0006575 / secondo
0,000625 / 1000 caratteri
0,0000625 / secondo
0,001315 / immagine
0,001315 / secondo
0,00125 / 1000 caratteri
0,000125 / secondo
Contesto
Cache
Archiviazione
Input immagine
Input video
Input testo
Input audio
0,0011835 / immagine / ora
0,0011835 / secondo / ora
0,001125 / 1000 caratteri / ora
0,0001125 / secondo / ora

* I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
* Se un contesto di query è superiore a 128.000, tutti i token vengono addebitati a tariffe di contesto lunghe.
* L'output del modello viene fatturato senza memorizzazione nella cache.
* I PDF vengono fatturati come input di immagine, con una pagina PDF equivalente a un'immagine

Generazione di immagini

Con la funzionalità di generazione delle immagini di Vertex AI, puoi generare immagini nuove e modificarle in base ai prompt testuali da te forniti o modificare solo parti delle immagini utilizzando un'area maschera da te definita insieme a una serie di altre funzionalità.

Modello Funzionalità Description Input Output Prezzo
Imagen Generazione di immagini Genera un'immagine Prompt di testo Immagine 0,020 $ per immagine
Modifica delle immagini Modificare un'immagine utilizzando l'approccio senza maschera o con mascheramento Prompt immagine/testo Immagine 0,020 $ per immagine
Upscale Aumenta la risoluzione di un'immagine generata a 2K e 4K Immagine Immagine 0,003 $ per immagine
Ottimizzazione Attiva un "oggetto" fornito dall'utente da utilizzare nei prompt di Imagen (addestramento di pochi scatti) Soggetti con identificatore di testo e 4-8 immagini per soggetto Modello perfezionato (dopo l'addestramento con soggetti forniti dall'utente) $ per ora nodo (prezzi dell'addestramento personalizzato di Vertex AI)
Sottotitoli codificati visivi Genera una didascalia di testo breve o lunga per un'immagine Immagine Didascalia testuale 0,0015 $/immagine
Visual Question Answering Fornisci una risposta basata su una domanda che fa riferimento a un'immagine Prompt immagine/testo Risposta testuale 0,0015 $/immagine

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.

API Multimodal Embeddings

Modello Funzionalità Description Input Output Prezzo
incorporamento multimodale Incorporamenti per multimodale: testo Genera incorporamenti utilizzando il testo come input Testo Incorporamenti $0,0002 / 1000 caratteri inseriti
Incorporamenti per multimodale: immagine Genera incorporamenti utilizzando l'immagine come input Immagine Incorporamenti $0,0001 / input immagine
Incorporamenti per multimodale: video Video Plus Video Incorporamenti (fino a 15 incorporamenti al minuto di video) 0,0020 $ al secondo di video
Incorporamenti per multimodale: video Standard video Video Incorporamenti (fino a 8 incorporamenti al minuto di video) 0,0010 $ al secondo di video
Incorporamenti per multimodale: video Video essenziali Video Incorporamenti (fino a 4 incorporamenti al minuto di video) 0,0005 $ al secondo di video

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.

Generazione di testo

L'IA generativa su Vertex AI addebita ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati dai punti di codice UTF-8 e gli spazi vuoti sono esclusi dal conteggio. Durante la fase di anteprima, gli addebiti sono scontati del 100%. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo.

Modello Tipo Regione Prezzo per 1000 caratteri
PaLM 2 per il testo (Text Bison) Input Globale
  • Richieste online: $0,00025
  • Richieste batch: $0,00020
Output Globale
  • Richieste online: $0,0005
  • Richieste batch: $0,0004
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Apprendimento per rinforzo con feedback umano us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
PaLM 2 per testo 32k (Testo Bison 32k) Input Globale
  • Richieste online: $0,00025
  • Richieste batch: $0,00020
Output Globale
  • Richieste online: $0,0005
  • Richieste batch: $0,0004
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
PaLM 2 per il testo
(Testo Unicorno)
Input Globale
  • Richieste online: $0,0025
  • Richieste batch: $0,0020
Output Globale
  • Richieste online: $0,0075
  • Richieste batch: $0,0060
PaLM 2 per Chat (Chat Bison) Input Globale
  • Richieste online: $0,00025
Output Globale
  • Richieste online: $0,0005
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Apprendimento per rinforzo con feedback umano us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
PaLM 2 per Chat 32.000 (Chat Bison 32.000) Input Globale
  • Richieste online: $0,00025*
Output Globale
  • Richieste online: $0,0005*
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Incorporamenti per il testo Input Globale
  • Richieste online: $0,000025
  • Richieste batch: $0,00002
Output Globale
  • Richieste online: nessun costo
  • Richieste batch: nessun costo
Codey per la generazione del codice Input Globale
  • Richieste online: $0,00025
  • Richieste batch: $0,00020
Output Globale
  • Richieste online: $0,0005
  • Richieste batch: $0,0004
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Codey per la generazione del codice 32k Input Globale
  • Richieste online: $0,00025
Output Globale
  • Richieste online: $0,0005
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Codey per la chat di codice Input Globale
  • Richieste online: $0,00025
Output Globale
  • Richieste online: $0,0005
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Codey per la chat di codice 32k Input Globale
  • Richieste online: $0,00025
Output Globale
  • Richieste online: $0,0005
Ottimizzazione supervisionata us-central1
europe-west4
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI
Codey per il completamento del codice Input Globale
  • Richieste online: $0,00025
Output Globale
  • Richieste online: $0,0005

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.

Esempio di calcolo dei costi

Se un utente invia cinque richieste separate al modello PaLM Text Bison e ogni richiesta ha un input di 200 caratteri e un output di 400 caratteri, l'addebito totale viene calcolato come segue:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelli di partner

I modelli partner sono un elenco selezionato di modelli di AI generativa sviluppati dai partner di Google. I modelli dei partner vengono offerti come API gestite. Per ulteriori informazioni, consulta la Panoramica dei modelli dei partner. La seguente tabella elenca i dettagli dei prezzi per i modelli di partner di Google:

I modelli di Claude 3 di Anthropic

Modello Prezzi
Opus di Claude 3 Input: 15 $ / milione di token
Output: 75 $ / milione di token
Sonetto di Claude 3 Input: 3 $ / milione di token
Output: 15 $ / milione di token
Haiku Claude 3 Input: 0,25 $ / milione di token
Output: 1,25 $ / milione di token

Richiedi un preventivo personalizzato

Con i prezzi con pagamento a consumo di Google Cloud, paghi solo per i servizi che utilizzi. Per ricevere un preventivo personalizzato per la tua organizzazione, contatta il nostro team di vendita.
Contatta il team di vendita