Prezzi di Vertex AI
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
Questa pagina illustra i prezzi dell'IA generativa su Vertex AI. Per tutti gli altri prezzi di Vertex AI, inclusi i servizi ML Platform e MLOps, consulta la pagina dei prezzi di Vertex AI.
Modelli Google
Gemini
Con i modelli multimodali in Vertex AI, puoi inserire testo o contenuti multimediali (immagini, video). L'input testo viene addebitato per ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati in base ai punti di codice UTF-8 e gli spazi bianchi sono esclusi dal conteggio, con il risultato di circa 4 caratteri per token. Le richieste di previsione che generano risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo ($0,01) vengono arrotondate a un centesimo. L'input multimediale viene addebitato per immagine o per secondo (video).
Modello | Funzionalità | Tipo | Prezzo ( =< 128.000 token di input) |
Prezzo ( > 128.000 token di input) |
---|---|---|---|---|
Flash Gemini 1.5 | Multimodale | Input immagine Input video Input di testo Input audio |
0,00002 $ per immagine 0,00002$al secondo 0,00001875$per 1000 caratteri 0,000002$al secondo |
0,00004 $ per immagine 0,00004$al secondo 0,0000375$per 1000 caratteri 0,000004$al secondo |
Output di testo | 0,000075 $ per 1000 caratteri | 0,00015 $ per 1000 caratteri | ||
Ottimizzazione* | Token di formazione | 8 $ per M token | ||
Gemini 1.5 Pro | Multimodale | Input immagine Input video Input di testo Input audio |
0,00032875 $ per immagine 0,00032875$al secondo 0,0003125$per 1000 caratteri 0,00003125$al secondo |
0,0006575 $ per immagine 0,0006575$al secondo 0,000625$per 1000 caratteri 0,0000625$al secondo |
Output di testo | 0,00125 $ per 1000 caratteri | 0,0025 $ per 1000 caratteri | ||
Ottimizzazione* | Token di formazione | 80 $ / M token | ||
Gemini 1.0 Pro | Multimodale | Input immagine Input video Input di testo |
0,0025 $ per immagine 0,002$al secondo 0,000125$per 1000 caratteri |
|
Output di testo | 0,000375 $ per 1000 caratteri | |||
Grounding con la Ricerca Google | Testo | Richieste con grounding | 35 $ per 1000 richieste (fino a 1 milione di richieste al giorno). Contatta il team dedicato al tuo account se hai bisogno di più di 1 milione di richieste al giorno. |
* I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU della piattaforma Cloud.
* Se il contesto di una query è più lungo di 128.000 token, tutti i token vengono addebitati alle tariffe per contesto lungo.
* I modelli Gemini sono disponibili in modalità batch con uno sconto del 50%.
* Gemini 1.0 Pro supporta solo una finestra contestuale fino a 32.000 token.
* I PDF vengono fatturati come input di immagini, con una pagina PDF equivalente a un'immagine.
* L'endpoint del modello ottimizzato ha lo stesso prezzo di previsione del modello di base.
* Verifica dei fatti con la Ricerca Google: se utilizzi il recupero dinamico per ottimizzare i costi, la verifica dei fatti con la Ricerca Google comporta il pagamento solo per le richieste che contengono almeno un URL di supporto per la verifica dei fatti dal web nella risposta. I costi di Gemini si applicano sempre.
Imagen
Con Imagen su Vertex AI, puoi generare immagini nuove e modificarle in base a prompt di testo forniti, oppure modificare solo parti delle immagini utilizzando un'area maschera definita insieme a una serie di altre funzionalità.
Modello | Funzionalità | Descrizione | Input | Output | Prezzo |
---|---|---|---|---|---|
immagine 3 | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,04 $ per immagine |
Imagen 3 veloce | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,02 $ per immagine |
Imagen 2, | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,020 $ per immagine |
Modifica delle immagini | Modifica un'immagine usando l'approccio senza maschera o con maschera | Prompt immagine/testo | Immagine | 0,020 $ per immagine | |
Upscale | Aumenta la risoluzione di un'immagine generata a 2k e 4k | Immagine | Immagine | 0,003 $ per immagine | |
Ottimizzazione | Attivare un "soggetto" fornito dall'utente per essere utilizzato nei prompt di Imagen (addestramento few-shot) | Soggetti con identificatore di testo e 4-8 immagini per soggetto | Modello perfezionato (dopo l'addestramento con soggetti forniti dall'utente) | $ per ora nodo (prezzi dell'addestramento personalizzato di Vertex AI) | |
Didascalie visive | Genera una didascalia di testo breve o lungo per un'immagine | Immagine | Didascalia | 0,0015 $/immagine | |
Visual Question Answering | Fornire una risposta basata su una domanda che fa riferimento a un'immagine | Prompt immagine/testo | Risposta | 0,0015 $/immagine |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU della piattaforma Cloud .
Incorporamento
Modello | Funzionalità | Descrizione | Input | Output | Prezzo |
---|---|---|---|---|---|
rappresentazione multimodale | Incorporamenti per multimodale: testo | Genera rappresentazioni distribuite utilizzando il testo come input | Testo | Incorporamenti | 0,0002 $ per 1000 caratteri inseriti |
Incorporamenti per multimodale: immagine | Generare rappresentazioni nidificate utilizzando l'immagine come input | Immagine | Incorporamenti | 0,0001 $ per immagine in input | |
Incorporamenti per multimodale: Video Plus | Video Plus | Video | Incorporamenti (fino a 15 incorporamenti per minuto di video) | 0,0020 $ per secondo di video | |
Incorporamenti per multimodale: standard video | Video standard | Video | Incorporamenti (fino a 8 incorporamenti per minuto di video) | 0,0010 $ per secondo di video | |
Incorporamenti per multimodale: Video Essential | Video di base | Video | Incorporamenti (fino a 4 incorporamenti per minuto di video) | 0,0005 $ per secondo di video |
Modello | Tipo | Regione | Prezzo per 1000 caratteri |
---|---|---|---|
Incorporamenti per il testo | Input | Globale |
|
Output | Globale |
|
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Completamento del codice
L'IA generativa su Vertex AI viene addebitata in base a ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati in base ai punti di codice UTF-8 e gli spazi bianchi sono esclusi dal conteggio. Durante la fase di Anteprima, gli addebiti sono scontati al 100%. Le richieste di previsione che generano risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo.
Modello | Tipo | Regione | Prezzo per 1000 caratteri |
---|---|---|---|
Codey per il completamento del codice | Input | Globale |
|
Output | Globale |
|
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Traduzione (testo)
Utilizza l'API Vertex AI e l'LLM di traduzione per tradurre il testo. Le traduzioni LLM tendono ad essere più fluide e dal suono più umano rispetto ai modelli di traduzione classici, ma hanno una copertura linguistica più limitata (Scopri di più).
Modello | Metodo | Utilizzo | Prezzo per milione di caratteri |
---|---|---|---|
LLM | Traduzione di testi (Anteprima)* | Il numero di caratteri di input al mese |
10 $ ogni milione di caratteri* |
Il numero di caratteri di output al mese |
10 $ ogni milione di caratteri* |
I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU della piattaforma Cloud.
* Il prezzo viene calcolato per ogni carattere elaborato dal modello. Per informazioni dettagliate sui caratteri conteggiati, consulta Caratteri addebitati
Memorizzazione nella cache del contesto
Con la memorizzazione nella cache del contesto, puoi ridurre il costo dell'elaborazione del token di input di Gemini del 75% e la latenza della generazione di contenuti memorizzando nella cache la parte di contesto del tuo testo di input o dei tuoi contenuti multimediali nei modelli di Gemini. La quantità di tempo in cui i dati vengono archiviati nella cache, che può essere controllata dall'utente, determina gli addebiti per "Spazio di archiviazione della cache dei contesti". Quando viene creato un contesto nella cache, agli utenti verrà addebitato il costo standard del token di input. Gli hit della cache sui dati di input vengono addebitati a una tariffa ridotta, denominata "Input memorizzato nella cache", anziché al normale costo di input. Le dimensioni dei dati per archiviazione e input vengono calcolate nello stesso modo dei prezzi degli input di Gemini.
Modello | Funzionalità | Tipo | Prezzo ( =< 128.000 token di input) | Prezzo (> 128.000 token di input) |
---|---|---|---|---|
Flash Gemini 1.5 | Input memorizzato nella cache | Input immagine Input video Input di testo Input audio |
0,000005 / immagine 0,000005 / secondo 0,0000046875 / 1000 caratteri 0,0000005 / secondo |
0,00001 / immagine 0,00001 / secondo 0,000009375 / 1000 caratteri 0,000001 / secondo |
Spazio di archiviazione della cache del contesto | Input immagine Input video Input di testo Input audio |
0,000263 / immagine / ora 0,000263/ secondo / ora 0,00025 / 1000 caratteri / ora 0,000025 / secondo / ora |
||
Gemini 1.5 Pro | Input memorizzato nella cache | Input immagine Input video Input di testo Input audio |
0,0000821875 / immagine 0,0000821875 / secondo 0,000078125 / 1000 caratteri 0,0000078125 / secondo |
0,000164375 / immagine 0,000164375 / secondo 0,00015625 / 1000 caratteri 0,000015625 / secondo |
Spazio di archiviazione della cache del contesto | Input immagine Input video Input di testo Input audio |
0,0011835 / immagine / ora 0,0011835/ secondo / ora 0,001125 / 1000 caratteri / ora 0,0001125 / secondo / ora |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Esempio di calcolo del costo della cache
Se un utente crea un contesto memorizzato nella cache di 250.000 caratteri con un TTL di 2 ore e successivamente invia 20 richieste separate al modello Gemini 1.5 Pro durante quelle 2 ore, e ogni richiesta ha una query di 200 caratteri aggiunta al contesto memorizzato nella cache e un output di 400 caratteri, il costo totale viene calcolato come segue:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Esempio di calcolo dei costi
Se un utente invia cinque richieste separate al modello PaLM Text Bison e ogni richiesta ha un input di 200 caratteri e un output di 400 caratteri, l'addebito totale viene calcolato come segue:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelli partner
I modelli dei partner sono un elenco selezionato di modelli di AI generativa sviluppati dai partner di Google. I modelli dei partner vengono offerti come API gestite. Per ulteriori informazioni, vedi Panoramica dei modelli dei partner. Le sezioni seguenti riportano i dettagli dei prezzi per i modelli di partner Google.
Modelli di AI21 Lab
Modello | Prezzi |
---|---|
Jamba 1.5 large | Input: 2 $ / milione di token Output: 8 $ / milione di token |
Jamba 1,5 Mini | Input: 0,20 $ / milione di token Output: 0,40 $ / milione di token |
Modelli Claude di Anthropic
Modello | Prezzi |
---|---|
Claude 3.5 Haiku | Input: 1,00 € / milione di token Output: 5,00 € / milione di token |
Claude 3.5 Sonnet v2 | Input: 3 $ / milione di token Output: 15 $ / milione di token |
Claude 3.5 Sonnet | Input: 3 $ / milione di token Output: 15 $ / milione di token |
Claude 3 Haiku | Input: 0,25 $ / milione di token Output: 1,25 $ / milione di token |
Claude 3 Sonnet | Input: 3 $ / milione di token Output: 15 $ / milione di token |
Claude 3 Opus | Input: 15 $ / milione di token Output: 75 $ / milione di token |
Modelli di Llama di Meta
Modello | Prezzi |
---|---|
Llama 3.1 405B | Input: 5,00 $ / milione di token Output: 16,00 $ / milione di token |
Modelli di Mistral AI
Modello | Prezzi |
---|---|
Mistral Large (24,11) | Input: 2,00 $ / milione di token Output: 6,00 $ / milione di token |
Mistral Large (24,07) | Input: 2,00 $ / milione di token Output: 6,00 $ / milione di token |
Mistral | Input: 0,15 $ / milione di token Output: 0,15 $ / milione di token |
Codestral (24.05) | Input: 0,20 $ / milione di token Output: 0,60 $ / milione di token |