Prezzi di Vertex AI
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
Questa pagina illustra i prezzi per l'AI generativa su Vertex AI. Per tutti gli altri prezzi di Vertex AI, inclusi i servizi ML Platform e MLOps, consulta la pagina dei prezzi di Vertex AI.
Modelli Google
Gemini
Con i modelli multimodali in Vertex AI, puoi inserire testo o contenuti multimediali (immagini, video). L'input di testo viene addebitato ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri sono conteggiati in punti di codice UTF-8 e gli spazi vuoti vengono esclusi dal conteggio, risultando così circa 4 caratteri per token. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ciascun ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo. L'input di contenuti multimediali viene addebitato per immagine o al secondo (video).
Modello | Funzionalità | Tipo | Prezzo ( =< 128.000 token di input) |
Prezzo ( > 128.000 token di input) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodale | Input immagine Input video Input di testo Input audio |
0,00002 $ / immagine 0,00002 $ / secondo 0,00001875 $ / 1000 caratteri 0,000002 $ / secondo |
0,00004 $ / immagine 0,00004 $ / secondo 0,0000375 $ / 1000 caratteri 0,000004 $ / secondo |
Output di testo | $0,000075 / 1000 caratteri | $0,00015 / 1000 caratteri | ||
Ottimizzazione* | Token di addestramento | $8 / mln di token | ||
Gemini 1.5 Pro | Multimodale | Input immagine Input video Input di testo Input audio |
0,00032875 $ / immagine 0,00032875 $ / secondo 0,0003125 $ / 1000 caratteri 0,00003125 $ / secondo |
0,0006575 $ / immagine $0,0006575 / secondo $0,000625 / 1000 caratteri $0,0000625 / secondo |
Output di testo | $0,00125 / 1000 caratteri | 0,0025 $ / 1000 caratteri | ||
Ottimizzazione* | Token di addestramento | 80 $ / mln di token | ||
Gemini 1.0 Pro | Multimodale | Input immagine Input video Input di testo |
0,0025 $/immagine 0,002$al secondo 0,000$125/1000 caratteri |
|
Output di testo | $0,000375 / 1000 caratteri | |||
Fondamenta con la Ricerca Google | Testo | Richieste di grounding | 35 $ / 1000 richieste (per un massimo di 1 milione di richieste al giorno). Contatta il team dedicato al tuo account se hai bisogno di più di 1 milione di richieste al giorno. |
* I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli
SKU di Cloud Platform.
* Se il contesto di una query è superiore a 128.000, a tutti i token vengono addebitate tariffe di contesto lunghe.
* I modelli Gemini sono disponibili in modalità batch con uno sconto del 50%.
* Gemini 1.0 Pro supporta solo una finestra contestuale fino a 32.000.
* I PDF vengono fatturati come input di immagini, con una pagina PDF equivalente a un'immagine.
* L'endpoint del modello ottimizzato ha lo stesso prezzo di previsione del modello di base.
* grounding con la Ricerca Google: se usi il recupero dinamico per ottimizzare i costi, solo le richieste che contengono almeno un URL di supporto di grounding dal web nella loro risposta vengono addebitate per grounding con la Ricerca Google. Si applicano sempre i costi di Gemini.
Imagen
Con Imagen su Vertex AI, puoi generare immagini nuove e modificarle in base ai prompt di testo che fornisci oppure modificare solo parti delle immagini utilizzando un'area della maschera definita da te insieme a una serie di altre funzionalità.
Modello | Funzionalità | Descrizione | Input | Output | Prezzo |
---|---|---|---|---|---|
Imagen 3 | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,04 $ per immagine |
Imagen 3 veloce | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,02 $ per immagine |
Imagen 2, Imagen | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,020 $ per immagine |
Modifica delle immagini | Modifica un'immagine usando un approccio senza maschera o con maschera | Prompt di immagine/testo | Immagine | 0,020 $ per immagine | |
Upscale | Aumenta la risoluzione di un'immagine generata a 2K e 4K | Immagine | Immagine | 0,003 $ per immagine | |
Ottimizzazione | Consente di attivare un "soggetto" fornito dall'utente da usare nei prompt Imagen (addestramento con pochi scatti) | Soggetti con identificatore di testo e 4-8 immagini per soggetto | Modello ottimizzato (dopo l'addestramento con soggetti forniti dall'utente) | $ per ora nodo (prezzi dell'addestramento personalizzato di Vertex AI) | |
Sottotitoli codificati | Genera una didascalia di testo breve o lunga per un'immagine | Immagine | Didascalia testuale | 0,0015 $/immagine | |
Visual Question Answering | Fornisci una risposta basata su una domanda che fa riferimento a un'immagine | Prompt di immagine/testo | Risposta testuale | 0,0015 $/immagine |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Incorporamento
Modello | Funzionalità | Descrizione | Input | Output | Prezzo |
---|---|---|---|---|---|
incorporamento multimodale | Incorporamenti per multimodali: testo | Genera incorporamenti utilizzando il testo come input | Testo | Incorporamenti | $0,0002 / 1000 caratteri inseriti |
Incorporamenti per multimodali: immagine | Genera incorporamenti utilizzando un'immagine come input | Immagine | Incorporamenti | 0,0001 $ / input di immagine | |
Incorporamenti per modalità multimodale: Video Plus | Video Plus | Video | Incorporamenti (fino a 15 incorporamenti per minuto di video) | 0,0020 $ al secondo di video | |
Incorporamenti per multimodali: standard video | Standard video | Video | Incorporamenti (fino a 8 incorporamenti per minuto di video) | 0,0010 $ al secondo di video | |
Incorporamenti per il multimodale: nozioni di base sui video | Nozioni di base sui video | Video | Incorporamenti (fino a 4 incorporamenti per minuto di video) | 0,0005 $ al secondo di video |
Modello | Tipo | Regione | Prezzo per 1000 caratteri |
---|---|---|---|
Incorporamenti per il testo | Input | Globale |
|
Output | Globale |
|
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Completamento del codice
L'IA generativa su Vertex AI addebita i costi ogni 1000 caratteri di input (messaggio) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati in base ai punti di codice UTF-8 e gli spazi vuoti sono esclusi dal conteggio. Durante la fase di anteprima, gli addebiti sono scontati del 100%. Le richieste di previsione che generano risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo.
Modello | Tipo | Regione | Prezzo per 1000 caratteri |
---|---|---|---|
Codey per il completamento del codice | Input | Globale |
|
Output | Globale |
|
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Traduzione (testo)
Utilizzare l'API Vertex AI e l'LLM di traduzione per tradurre il testo. Le traduzioni LLM tendono a essere più fluente e umana rispetto ai modelli di traduzione classici, ma hanno un supporto linguistico più limitato (Scopri di più).
Modello | Metodo | Utilizzo | Prezzo per milione di caratteri |
---|---|---|---|
LLM | Traduzione del testo (anteprima)* | Il numero di caratteri di input al mese |
10 $ ogni milione di caratteri* |
Il numero di caratteri di output al mese |
10 $ ogni milione di caratteri* |
I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli
SKU di Cloud Platform.
* Il prezzo viene calcolato per carattere elaborato dal modello. Per informazioni dettagliate sui caratteri conteggiati, vedi Caratteri addebitati
Memorizzazione nella cache del contesto
Con la memorizzazione nella cache del contesto, puoi ridurre del 75% il costo dell'elaborazione del token di input di Gemini e la latenza della generazione di contenuti memorizzando nella cache la parte di contesto del testo o dei contenuti multimediali di input nei modelli Gemini. Gli addebiti per l'archiviazione della cache contestuale sono determinati dalla quantità di tempo per cui i dati vengono archiviati nella cache, che può essere controllata dall'utente. Quando creano un contesto memorizzato nella cache, agli utenti viene addebitato il costo del token di input standard. Gli hit della cache nei dati di input vengono addebitati a una tariffa ridotta, "Input nella cache", invece del normale costo di input. Le dimensioni dei dati sia per l'archiviazione che per l'input vengono calcolate allo stesso modo dei prezzi dell'input di Gemini.
Modello | Funzionalità | Tipo | Prezzo ( =< 128.000 token di input ) | Prezzo ( > 128.000 token di input ) |
---|---|---|---|---|
Gemini 1.5 Flash | Input memorizzato nella cache | Input immagine Input video Input di testo Input audio |
0,000005 / immagine 0,000005 / secondo 0,0000046875 / 1000 caratteri 0,0000005 / secondo |
0,00001 / immagine 0,00001 / secondo 0,000009375 / 1000 caratteri 0,000001 / secondo |
Archiviazione cache di contesto | Input immagine Input video Input di testo Input audio |
0,000263 / immagine / h 0,000263/ second / h 0,00025 / 1000 caratteri / ora 0,000025 / second / h |
||
Gemini 1.5 Pro | Input memorizzato nella cache | Input immagine Input video Input di testo Input audio |
0,0000821875 / immagine 0,0000821875 / secondo 0,000078125 / 1000 caratteri 0,0000078125 / secondo |
0,000164375 / immagine 0,000164375 / secondo 0,00015625 / 1000 caratteri 0,000015625 / secondo |
Archiviazione cache di contesto | Input immagine Input video Input di testo Input audio |
0,0011835 / immagine / h 0,0011835/ second / h 0,001125 / 1000 caratteri / ora 0,0001125 / second / h |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Esempio di calcolo dei costi memorizzati nella cache
Se un utente crea un contesto memorizzato nella cache di 250.000 caratteri con un TTL di 2 ore e successivamente invia venti richieste separate al modello Gemini 1.5 Pro durante queste 2 ore, con una query di 200 caratteri aggiunta al contesto memorizzato nella cache e un output di 400 caratteri, il costo totale viene calcolato come segue:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Esempio di calcolo dei costi
Se un utente invia cinque richieste separate al modello PaLM Text Bison e ciascuna richiesta ha un input di 200 caratteri e un output di 400 caratteri, il costo totale viene calcolato come segue:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelli dei partner
I modelli partner sono un elenco selezionato di modelli di AI generativa sviluppati dai partner di Google. I modelli partner sono offerti come API gestite. Per scoprire di più, consulta la Panoramica dei modelli dei partner. Le sezioni seguenti elencano i dettagli dei prezzi per i modelli dei partner di Google.
Modelli di AI21 Lab
Modello | Prezzi |
---|---|
Jamba 1.5 Large | Input: $2 / milioni di token Output: $8 / milioni di token |
Jamba 1.5 Mini | Input: 0,20 $ / milioni di token Output: 0,40 $ / milioni di token |
I modelli di Claude di Anthropic
Modello | Prezzi |
---|---|
Claude 3.5 Haiku | Input: 1,00 $ / milioni di token Output: 5,00 $ / milioni di token |
Claude 3.5 Sonnet v2 | Input: $3 / milioni di token Output: $15 / milioni di token |
Claude 3.5 Sonnet | Input: $3 / milioni di token Output: $15 / milioni di token |
Claude 3 Haiku | Input: 0,25 $ / milioni di token Output: 1,25 $ / milioni di token |
Claude 3 Sonnet | Input: $3 / milioni di token Output: $15 / milioni di token |
Claude 3 Opus | Input: $15 / milioni di token Output: $75 / milioni di token |
Modelli Llama di Meta
Modello | Prezzi |
---|---|
Llama 3.1 405B | Input: 5 $ per milione di token Output: 16 $ per milione di token |
Modelli di Mistral AI
Modello | Prezzi |
---|---|
Mistral grande (2407) | Input: $2 / milioni di token Output: $6 / milioni di token |
Mistral Nemo | Input: 0,15 $ / milioni di token Output: 0,15 $ / milioni di token |
Codestral | Input: 0,20 $ / milioni di token Output: 0,60 $ / milioni di token |