Prezzi di Vertex AI
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .
Questa pagina illustra i prezzi per Generative AI su Vertex AI. Per tutti gli altri prezzi di Vertex AI, inclusi i servizi ML Platform e MLOps, consulta la pagina dei prezzi di Vertex AI.
Modelli di base di Google
Multimodale
Con i modelli multimodali in Vertex AI, puoi inserire testo o contenuti multimediali (immagini, video). L'input del testo viene addebitato ogni 1000 caratteri di input (messaggio) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati da punti di codice UTF-8 e gli spazi vuoti vengono esclusi dal conteggio, determinando circa 4 caratteri per token. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo. L'input multimediale viene addebitato in base all'immagine o al secondo (video).
Modello | Selezione delle | Tipo | Prezzo ( =< 128.000 finestra di contesto) |
Prezzo ( > finestra di contesto 128.000) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodale | Input immagine Input video Input testo Input audio |
$0,0001315 / immagine $0,0001315 / secondo $0,000125 / 1000 caratteri $0,0000125 / secondo |
$0,000263 / immagine $0,000263 / secondo $0,00025 / 1000 caratteri $0,000025 / secondo |
Output testo | $0,000375 / 1000 caratteri | $0,00075 / 1000 caratteri | ||
Gemini 1.5 Pro | Multimodale | Input immagine Input video Input testo Input audio |
$0,001315 / immagine $0,001315 / secondo $0,00125 / 1000 caratteri $0,000125 / secondo |
$0,00263 / immagine $0,00263 / secondo $0,0025 / 1000 caratteri $0,00025 / secondo |
Output testo | $0,00375 / 1000 caratteri | $0,0075 / 1000 caratteri | ||
Gemini 1.0 Pro | Multimodale | Input immagine Input video Input testo |
$0,0025 / immagine $0,002 / secondo $0,000125 / 1000 caratteri |
|
Output testo | $0,000375 / 1000 caratteri | |||
grounding con la Ricerca Google | Testo | Richieste di grounding | 35 $ / 1000 richieste (per un massimo di 1 milione di richieste al giorno). Contatta il team dedicato al tuo account se hai bisogno di più di un milione di richieste al giorno. |
* I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
* Se un contesto di query è superiore a 128.000, tutti i token vengono addebitati a tariffe di contesto lunghe.
* I modelli Gemini sono disponibili in modalità batch con uno sconto del 50%.
* Gemini 1.0 Pro supporta solo una finestra di contesto fino a 32K.
* I PDF vengono fatturati come input di immagine, con una pagina PDF equivalente a un'immagine
Modello | Selezione delle | Tipo | Prezzo |
---|---|---|---|
Gemini 1.5 Pro | Multimodale | Input immagine Input video Input testo Input audio |
$0,00265 / immagine $0,00265 / secondo $0,0025 / 1000 caratteri $0,00025 / secondo |
Output testo | $0,0075 / 1000 caratteri |
Memorizzazione nella cache del contesto
Con la memorizzazione nella cache del contesto, puoi ridurre i costi e la latenza della generazione di contenuti memorizzando nella cache la parte di contesto del testo o dell'elemento multimediale di input nei modelli Gemini. Gli addebiti relativi all'opzione "Archiviazione cache contestuale" sono determinati dalla quantità di tempo in cui i dati vengono archiviati nella cache, che può essere controllata dall'utente. Gli hit della cache per i dati di input vengono addebitati a una tariffa ridotta, "Input memorizzato nella cache", anziché al normale costo di input. Le dimensioni dei dati sia per lo spazio di archiviazione che per l'input vengono calcolate nello stesso modo del prezzo di input di Gemini.
Modello | Selezione delle | Tipo | Prezzo ( =< 128.000 finestra di contesto) |
Prezzo per un contesto lungo ( > 128.000 finestra di contesto) |
---|---|---|---|---|
Gemini 1.5 Pro | Ingresso memorizzato nella cache |
Input immagine Input video Input testo Input audio |
0,0006575 / immagine 0,0006575 / secondo 0,000625 / 1000 caratteri 0,0000625 / secondo |
0,001315 / immagine 0,001315 / secondo 0,00125 / 1000 caratteri 0,000125 / secondo |
Contesto Cache Archiviazione |
Input immagine Input video Input testo Input audio |
0,0011835 / immagine / ora 0,0011835 / secondo / ora 0,001125 / 1000 caratteri / ora 0,0001125 / secondo / ora |
* I prezzi sono indicati in dollari statunitensi (USD).
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
* Se un contesto di query è superiore a 128.000, tutti i token vengono addebitati a tariffe di contesto lunghe.
* L'output del modello viene fatturato senza memorizzazione nella cache.
* I PDF vengono fatturati come input di immagine, con una pagina PDF equivalente a un'immagine
Generazione di immagini
Con la funzionalità di generazione delle immagini di Vertex AI, puoi generare immagini nuove e modificarle in base ai prompt testuali da te forniti o modificare solo parti delle immagini utilizzando un'area maschera da te definita insieme a una serie di altre funzionalità.
Modello | Funzionalità | Description | Input | Output | Prezzo |
---|---|---|---|---|---|
Imagen | Generazione di immagini | Genera un'immagine | Prompt di testo | Immagine | 0,020 $ per immagine |
Modifica delle immagini | Modificare un'immagine utilizzando l'approccio senza maschera o con mascheramento | Prompt immagine/testo | Immagine | 0,020 $ per immagine | |
Upscale | Aumenta la risoluzione di un'immagine generata a 2K e 4K | Immagine | Immagine | 0,003 $ per immagine | |
Ottimizzazione | Attiva un "oggetto" fornito dall'utente da utilizzare nei prompt di Imagen (addestramento di pochi scatti) | Soggetti con identificatore di testo e 4-8 immagini per soggetto | Modello perfezionato (dopo l'addestramento con soggetti forniti dall'utente) | $ per ora nodo (prezzi dell'addestramento personalizzato di Vertex AI) | |
Sottotitoli codificati visivi | Genera una didascalia di testo breve o lunga per un'immagine | Immagine | Didascalia testuale | 0,0015 $/immagine | |
Visual Question Answering | Fornisci una risposta basata su una domanda che fa riferimento a un'immagine | Prompt immagine/testo | Risposta testuale | 0,0015 $/immagine |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
API Multimodal Embeddings
Modello | Funzionalità | Description | Input | Output | Prezzo |
---|---|---|---|---|---|
incorporamento multimodale | Incorporamenti per multimodale: testo | Genera incorporamenti utilizzando il testo come input | Testo | Incorporamenti | $0,0002 / 1000 caratteri inseriti |
Incorporamenti per multimodale: immagine | Genera incorporamenti utilizzando l'immagine come input | Immagine | Incorporamenti | $0,0001 / input immagine | |
Incorporamenti per multimodale: video | Video Plus | Video | Incorporamenti (fino a 15 incorporamenti al minuto di video) | 0,0020 $ al secondo di video | |
Incorporamenti per multimodale: video | Standard video | Video | Incorporamenti (fino a 8 incorporamenti al minuto di video) | 0,0010 $ al secondo di video | |
Incorporamenti per multimodale: video | Video essenziali | Video | Incorporamenti (fino a 4 incorporamenti al minuto di video) | 0,0005 $ al secondo di video |
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
Generazione di testo
L'IA generativa su Vertex AI addebita ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati dai punti di codice UTF-8 e gli spazi vuoti sono esclusi dal conteggio. Durante la fase di anteprima, gli addebiti sono scontati del 100%. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo.
Modello | Tipo | Regione | Prezzo per 1000 caratteri |
---|---|---|---|
PaLM 2 per il testo (Text Bison) | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Apprendimento per rinforzo con feedback umano | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
PaLM 2 per testo 32k (Testo Bison 32k) | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
PaLM 2 per il testo (Testo Unicorno) |
Input | Globale |
|
Output | Globale |
|
|
PaLM 2 per Chat (Chat Bison) | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Apprendimento per rinforzo con feedback umano | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
PaLM 2 per Chat 32.000 (Chat Bison 32.000) | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Incorporamenti per il testo | Input | Globale |
|
Output | Globale |
|
|
Codey per la generazione del codice | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Codey per la generazione del codice 32k | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Codey per la chat di codice | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Codey per la chat di codice 32k | Input | Globale |
|
Output | Globale |
|
|
Ottimizzazione supervisionata | us-central1 europe-west4 |
$ per ora nodo Prezzi dell'addestramento personalizzato di Vertex AI | |
Codey per il completamento del codice | Input | Globale |
|
Output | Globale |
|
I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
Esempio di calcolo dei costi
Se un utente invia cinque richieste separate al modello PaLM Text Bison e ogni richiesta ha un input di 200 caratteri e un output di 400 caratteri, l'addebito totale viene calcolato come segue:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelli di partner
I modelli partner sono un elenco selezionato di modelli di AI generativa sviluppati dai partner di Google. I modelli dei partner vengono offerti come API gestite. Per ulteriori informazioni, consulta la Panoramica dei modelli dei partner. La seguente tabella elenca i dettagli dei prezzi per i modelli di partner di Google:
I modelli di Claude 3 di Anthropic
Modello | Prezzi |
---|---|
Opus di Claude 3 | Input: 15 $ / milione di token Output: 75 $ / milione di token |
Sonetto di Claude 3 | Input: 3 $ / milione di token Output: 15 $ / milione di token |
Haiku Claude 3 | Input: 0,25 $ / milione di token Output: 1,25 $ / milione di token |