Prezzi di Vertex AI

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.

Questa pagina illustra i prezzi per l'AI generativa su Vertex AI. Per tutti gli altri prezzi di Vertex AI, inclusi i servizi ML Platform e MLOps, consulta la pagina dei prezzi di Vertex AI.

Modelli Google

Gemini

Con i modelli multimodali in Vertex AI, puoi inserire testo o contenuti multimediali (immagini, video). L'input di testo viene addebitato ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri sono conteggiati in punti di codice UTF-8 e gli spazi vuoti vengono esclusi dal conteggio, risultando così circa 4 caratteri per token. Le richieste di previsione che portano a risposte filtrate vengono addebitate solo per l'input. Alla fine di ciascun ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo. L'input di contenuti multimediali viene addebitato per immagine o al secondo (video).

Modello Selezione delle Tipo Prezzo
( =< finestra contestuale di 128.000)
Prezzo
(finestra contestuale > 128.000)
Gemini 1.5 Flash Multimodale Input immagine
Input video
Input di testo
Input audio
0,0001315 $ / immagine
0,0001315 $ / secondo
0,000125 $ / 1000 caratteri
0,0000125 $ / secondo
0,000263 $ / immagine
0,000263 $ / secondo
0,00025 $ / 1000 caratteri
0,000025 $ / secondo
Output di testo $0,000375 / 1000 caratteri $0,00075 / 1000 caratteri
Gemini 1.5 Pro Multimodale Input immagine
Input video
Input di testo
Input audio
0,001315 $/immagine
0,001315$al secondo
0,00125 $/1000 caratteri
0,000125$al secondo
0,00263 $/immagine
0,00263$al secondo
0,0025 $/1000 caratteri
0,00025$al secondo
Output di testo $0,00375 / 1000 caratteri $0,0075 / 1000 caratteri
Gemini 1.0 Pro Multimodale Input immagine
Input video
Input di testo
0,0025 $/immagine
0,002$al secondo
0,000$125/1000 caratteri
Output di testo $0,000375 / 1000 caratteri
Fondamenta con la Ricerca Google Testo Richieste di grounding 35 $ / 1000 richieste (per un massimo di 1 milione di richieste al giorno).
Contatta il team dedicato al tuo account se hai bisogno di più
di 1 milione di richieste al giorno.

* I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform.
* Se il contesto di una query è superiore a 128.000, a tutti i token vengono addebitate tariffe di contesto lunghe.
* I modelli Gemini sono disponibili in modalità batch con uno sconto del 50%.
* Gemini 1.0 Pro supporta solo una finestra contestuale fino a 32.000.
* I PDF vengono fatturati come input di immagini, con una pagina PDF equivalente a un'immagine

Imagen

Con la funzionalità di generazione delle immagini di Vertex AI, puoi generare nuove immagini e modificarle in base ai prompt di testo che fornisci o modificare solo parti delle immagini utilizzando un'area maschera da te definita insieme a una serie di altre funzionalità.

Modello Funzionalità Descrizione Input Output Price
Imagen Generazione di immagini Genera un'immagine Prompt di testo Immagine 0,020 $ per immagine
Modifica delle immagini Modifica un'immagine usando un approccio senza maschera o con maschera Prompt di immagine/testo Immagine 0,020 $ per immagine
Upscale Aumenta la risoluzione di un'immagine generata a 2K e 4K Immagine Immagine 0,003 $ per immagine
Ottimizzazione Consente di attivare un "soggetto" fornito dall'utente da usare nei prompt Imagen (addestramento con pochi scatti) Soggetti con identificatore di testo e 4-8 immagini per soggetto Modello ottimizzato (dopo l'addestramento con soggetti forniti dall'utente) $ per ora nodo (prezzi dell'addestramento personalizzato di Vertex AI)
Sottotitoli codificati Genera una didascalia di testo breve o lunga per un'immagine Immagine Didascalia testuale 0,0015 $/immagine
Visual Question Answering Fornisci una risposta in base a una domanda che fa riferimento a un'immagine Prompt di immagine/testo Risposta testuale 0,0015 $/immagine

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .

Incorporamento

Modello Funzionalità Descrizione Input Output Price
incorporamento multimodale Incorporamenti per multimodali: testo Genera incorporamenti utilizzando il testo come input Testo Incorporamenti $0,0002 / 1000 caratteri inseriti
Incorporamenti per multimodali: immagine Genera incorporamenti utilizzando un'immagine come input Immagine Incorporamenti 0,0001 $ / input di immagine
Incorporamenti per modalità multimodale: Video Plus Video Plus Video Incorporamenti (fino a 15 incorporamenti al minuto di video) 0,0020 $ al secondo di video
Incorporamenti per multimodali: standard video Standard video Video Incorporamenti (fino a 8 incorporamenti per minuto di video) 0,0010 $ al secondo di video
Incorporamenti per il multimodale: nozioni di base sui video Nozioni di base sui video Video Incorporamenti (fino a 4 incorporamenti per minuto di video) 0,0005 $ al secondo di video
Modello Tipo Regione Prezzo per 1000 caratteri
Incorporamenti per il testo Salvaguardie Globale
  • Richieste online: 0,000025 $
  • Richieste batch: $0,00002
Salvaguardie Globale
  • Richieste online: nessun costo
  • Richieste batch: nessun costo

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .

Completamento del codice

L'IA generativa su Vertex AI addebita ogni 1000 caratteri di input (prompt) e ogni 1000 caratteri di output (risposta). I caratteri vengono conteggiati in base ai punti di codice UTF-8 e gli spazi vuoti sono esclusi dal conteggio. Durante la fase di anteprima, gli addebiti sono scontati del 100%. Le richieste di previsione che generano risposte filtrate vengono addebitate solo per l'input. Alla fine di ogni ciclo di fatturazione, le frazioni di un centesimo (0,01 $) vengono arrotondate a un centesimo.

Modello Tipo Regione Prezzo per 1000 caratteri
Codey per il completamento del codice Salvaguardie Globale
  • Richieste online: 0,00025 $
Salvaguardie Globale
  • Richieste online: 0,0005 $

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .

Memorizzazione nella cache del contesto

Con la memorizzazione nella cache del contesto, puoi ridurre del 75% il costo dell'elaborazione del token di input di Gemini e la latenza della generazione di contenuti memorizzando nella cache la parte di contesto del testo o dei contenuti multimediali di input nei modelli Gemini. Gli addebiti per l'archiviazione della cache contestuale sono determinati dalla quantità di tempo per cui i dati vengono archiviati nella cache, che può essere controllata dall'utente. Gli hit della cache nei dati di input vengono addebitati a una tariffa ridotta, "Input nella cache", invece del normale costo di input. Le dimensioni dei dati sia per l'archiviazione che per l'input vengono calcolate allo stesso modo dei prezzi dell'input di Gemini.

Modello Funzionalità Tipo Prezzo ( =< finestra contestuale di 128.000 ) Prezzo (finestra di contesto > 128.000)
Gemini 1.5 Flash Input memorizzato nella cache Input immagine
Input video
Input di testo
Input audio
0,000032875 / immagine
0,000032875 / secondo
0,00003125 / 1000 caratteri
0,000003125 / secondo
0,00006575 / immagine
0,00006575 / secondo
0,0000625 / 1000 caratteri
0,00000625 / secondo
Archiviazione cache di contesto Input immagine
Input video
Input di testo
Input audio
0,000263 / immagine / h
0,000263/ second / h
0,00025 / 1000 caratteri / ora
0,000025 / second / h
Gemini 1.5 Pro Input memorizzato nella cache Input immagine
Input video
Input di testo
Input audio
0,00032875 / immagine
0,00032875 / secondo
0,0003125 / 1000 caratteri
0,00003125 / secondo
0,0006575 / immagine
0,0006575 / secondo
0,000625 / 1000 caratteri
0,0000625 / secondo
Archiviazione cache di contesto Input immagine
Input video
Input di testo
Input audio
0,0011835 / immagine / h
0,0011835/ second / h
0,001125 / 1000 caratteri / ora
0,0001125 / second / h

I prezzi sono indicati in dollari statunitensi (USD). Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella tua valuta negli SKU di Cloud Platform .

Esempio di calcolo dei costi

Se un utente invia cinque richieste separate al modello PaLM Text Bison e ciascuna richiesta ha un input di 200 caratteri e un output di 400 caratteri, il costo totale viene calcolato come segue:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelli dei partner

I modelli partner sono un elenco selezionato di modelli di AI generativa sviluppati dai partner di Google. I modelli partner sono offerti come API gestite. Per scoprire di più, consulta la Panoramica dei modelli dei partner. La seguente tabella elenca i dettagli dei prezzi per i modelli di partner di Google:

I modelli Claude di Anthropic

Modello Prezzi
Claude 3.5 Sonnet Input: $3 / milioni di token
Output: $15 / milioni di token
Claude 3 Opus Input: $15 / milioni di token
Output: $75 / milioni di token
Claude 3 Haiku Input: 0,25 $ / milioni di token
Output: 1,25 $ / milioni di token
Claude 3 Sonetto Input: $3 / milioni di token
Output: $15 / milioni di token

Richiedi un preventivo personalizzato

Con i prezzi con pagamento a consumo di Google Cloud, paghi solo per i servizi che utilizzi. Per ricevere un preventivo personalizzato per la tua organizzazione, contatta il nostro team di vendita.
Contatta il team di vendita