Prezzi di Vertex AI Agent Builder

I prezzi sono indicati in dollari statunitensi (USD).

I prezzi delle funzionalità in disponibilità generale (GA) elencate vengono richiamati il 1° settembre 2023.

Vertex AI Agent Builder consente agli sviluppatori, anche quelli con competenze limitate di machine learning, di sfruttare la potenza dei modelli linguistici di grandi dimensioni (LLM), delle competenze nella ricerca e delle tecnologie di AI conversazionale di base di Google, per creare applicazioni di AI generativa di livello enterprise

Crediti di prova e Assistenza

Vengono assegnati 1000$ di crediti di prova GRATUITI per l'utilizzo con Vertex AI Agent Builder. Questi crediti sono validi per un periodo di 1 anno a partire dalla registrazione dell'account con Vertex AI Agent Builder a partire dal 18 luglio 2023.

Hai domande sulla funzionalità GA o sulla confezione e sui prezzi delle funzionalità in anteprima?

Contatta il team di vendita di Google Cloud per ulteriori informazioni.

Prezzi di Vertex AI Agents

Vertex AI Agent Builder offre la possibilità di creare rapidamente agenti virtuali (chatbot) che generano risposte in base ai contenuti (sito web, documenti) che includi nei datastore. Utilizzando gli Agenti Vertex AI, puoi creare un nuovo Dialogflow CX agente virtuale OPPURE aggiungi la funzionalità a un agente virtuale Dialogflow CX esistente.

Per aggiungere ulteriori funzionalità di AI generativa agli agenti virtuali Dialogflow CX, puoi sfruttare i Ricorsi generativi, che utilizzano un modello linguistico di grandi dimensioni (LLM) per gestire agevolmente scenari in cui non c'è alcuna corrispondenza con l'intento dell'utente. I generatori consentono agli sviluppatori di bot di inserire azioni generative in qualsiasi punto del flusso di conversazione, ad esempio per riassumere una conversazione, personalizzare un'interazione o concatenare più chiamate LLM per creare un intero flusso di lavoro generativo.

Prezzi per la funzionalità GA di Vertex AI Agents

Chat di Vertex AI Agents* 12,00 $ / 1000 query**
Voce di Vertex AI Agents* 0,002 $ al secondo†
Dialogflow CX Chat***(funzionalità standard, di IA non generativa per Chat) 7,00 $ / 1000 query**
Dialogflow CX Voice***(Funzionalità standard, di IA non generativa per Voice) 0,001 $ al secondo†
* Tutte le funzionalità di IA generativa: gli agenti di datastore, i fallback generativi, i generatori e le app Agent sono coperti dai prezzi degli SKU di Chat e Voice di Vertex AI. Se utilizzi più tipi di funzionalità di IA generativa in una singola richiesta, ti verrà addebitato separatamente il costo di ogni funzionalità in base al suo utilizzo.

* I clienti possono combinare query al secondo di Dialogflow CX (non generativa) e di agenti Vertex AI (generativi) nello stesso agente o nello stesso flusso e gli verrà addebitato automaticamente l'utilizzo effettivo di ciascun set di funzionalità. In questo modo, puoi sfruttare selettivamente AI generativa, ove applicabile, e pagare solo per ciò che effettivamente utilizzi.

**Richiesta (o query): fatturazione misurata per singola richiesta o query.
Per richiesta o query si intende qualsiasi chiamata API al servizio Dialogflow o al servizio Vertex AI Agents, diretta tramite l'utilizzo dell'API o indiretta tramite l'integrazione o la console.
Ad esempio, un utente che fa una domanda a un agente virtuale (chatbot) e il chatbot risponde è 1 richiesta. Un'interazione dell'utente con il chatbot può essere composta da più richieste per svolgere un'attività.

† Include riconoscimento vocale, conversione della voce in testo (STT), sintesi vocale, sintesi vocale (TTS) e telefonia. La durata totale dell'elaborazione audio fatturata è indipendente da qualsiasi elaborazione senza costi e non audio (latenza API, elaborazione webhook e così via) che può verificarsi prima, durante o dopo l'elaborazione audio.

* Dialogflow CX Chat e Dialogflow CX Voice non sono idonei per i crediti di prova GRATUITI di 1000 $. Dialogflow CX offre un programma di crediti di prova aggiuntivo che può essere combinato con questo programma di crediti di prova GRATUITO di Vertex AI Agent Builder. Consulta ulteriori definizioni della misurazione di Dialogflow CX qui.

Esempio di prezzi per la funzionalità GA di Vertex AI Agents

Esempio di combinazione di risposte basate sull'intenzione e generative: assistenza clienti sul sito web

  • Vengono utilizzati flussi deterministici basati sull'intenzione per alcune domande specifiche del cliente (fatturazione, pagamento)
  • Risposte generative utilizzate per gestire domande in cui non viene definito alcun intento, ma la risposta è presente sul sito web

Ipotesi:

  • 100 Mln di visite annuali al sito web
  • Il 5% dei visitatori utilizza il chatbot, 3 query per utilizzo, il 50% generativo, il 50% basato sull'intenzione
Volume SKU Frequenza Prezzo di listino totale
Chat Dialogflow CX (basata su intent)
7,5 milioni all'anno
100 milioni*5% di utilizzo*3 query*50% basati sull'intenzione
* $7,00 / 1000 query = 52.500 $
Dialogflow CX Enterprise Chat (generativa)
7,5 milioni all'anno
100 milioni*5% di utilizzo*3 query*50% generativo
* $12,00 / 1000 query = 90.000 $
Dati indicizzati
50 GB all'anno
10 GB disponibili, quindi 40 GB utilizzati nel calcolo del prezzo
* 5,00 $ / GB * 12 mesi = 2400 $

Prezzi di Vertex AI Search

Vertex AI Agent Builder offre la possibilità di creare rapidamente motori di ricerca per siti web, dati non strutturati e dati strutturati per recuperare informazioni e generare risposte fondate. Puoi scoprire di più sulle funzionalità disponibili in Vertex AI Search.

Prezzi per la funzionalità GA di Vertex AI Search

Versione standard della rete di ricerca* 2,00 $ / 1000 query
Search Enterprise Edition* 4,00 $ / 1000 query
Componente aggiuntivo LLM ricerca di base** +4,00 $ / 1000 query di input utente**
Componente aggiuntivo LLM ricerca avanzata** +10,00 $ / 1000 query di input utente**
Versione standard della rete di ricerca - Funzionalità di ricerca non strutturata
Search Enterprise Edition - Funzionalità di ricerca non strutturata + Ricerca sul sito web
Componente aggiuntivo LLM di ricerca di base**: fornisci risposte e riepiloghi a semplici query a turno singolo o in più passaggi, con la possibilità di elaborare query semplici, query composte, query lunghe e in più passaggi, con supporto di modelli tra cui TextBison, Gemini 1.0 Series, Gemini 1.5 Flash (Link)
Componente aggiuntivo LLM di ricerca avanzata** (attualmente in anteprima pubblica, GA, 1° luglio 2024): fornisci risposte e riepiloghi alle query multi-hop (una query che contiene due o più domande nidificate, la risposta a una che chiarisce la domanda successiva a cui deve rispondere molto), modelli di supporto tra cui TextBison, Gemini 1.0 Series, Gemini 1.5 Flash (Link). Abbiamo addebitato il numero di query input utente, non il numero di hop
Anteprima privata: ricerca strutturata + Nuove funzionalità di IA generativa (contatta il team di vendita per le funzionalità più recenti)

*Query: fatturazione misurata per singola richiesta o input di query
Per richiesta o query si intende qualsiasi chiamata API a Enterprise Search, diretta con l'utilizzo dell'API o indiretta tramite l'integrazione o la console.
Esempio: un utente che fa una domanda in linguaggio naturale e la risposta del motore di ricerca è una query.

** Il componente aggiuntivo LLM è aggiunte a una query per aumentare l'elaborazione in modo da utilizzare un'IA generativa funzionalità,
Il componente aggiuntivo LLM può essere utilizzato in modo intercambiabile con Search Standard Edition o Search Enterprise Edition.
Esempio: esecuzione di una query Search Enterprise con una richiesta di riassunto = 1 query Search Enterprise + 1 query di componente aggiuntivo LLM

Esempio di prezzi per la funzionalità GA di Vertex AI Search

Esempio di dati non strutturati : ricerca documenti

Ipotesi:

  • 10 milioni di query della versione Standard all'anno
  • 10 milioni di query Enterprise Edition con 10 milioni di query di riepilogo LLM all'anno
  • 100.000 documenti a ~1 MB ciascuno
Volume SKU Frequenza Prezzo di listino totale
Ricerca standard
10 milioni all'anno * $2,00 / 1000 query = 20.000 $
Ricerca aziendale
10 milioni all'anno * $4,00 / 1000 query = $ 40.000
Componente aggiuntivo LLM ricerca di base
Ogni query aggiunta a una query Standard o Enterprise
10 milioni all'anno * +$4,00 ogni 1000 query di input utente = OLTRE 40.000 $
Componente aggiuntivo LLM ricerca avanzata
Ogni query aggiunta a una query Standard o Enterprise
10 milioni all'anno * +$10,00 / 1000 query di input utente = OLTRE 100.000 $
Dati indicizzati
100 GB all'anno 10 GB gratuiti, quindi 90 GB utilizzati nel calcolo del prezzo * 5,00 $ / GB * 12 mesi = 5400 $

Prezzi di Data Index

Prezzi per l'archiviazione dei dati dell'indice di Vertex AI Agent Builder

Dati indicizzati 5,00 $ per GiB al mese
* Quota gratuita di 10 GiB al mese specificata
** Condiviso in Vertex AI Agent Builder
*** Lo spazio di archiviazione è calcolato come 500 kibibyte (KiB) * "numero di pagine sul sito web", dove 1 KiB è pari a 1024 byte. (500 KiB corrispondono a ~0,000477 GiB, quindi l'indicizzazione il prezzo per un sito web di 1000 pagine è di $2,38 al mese.)

Prezzi di Vertex AI Search for Healthcare

Vertex AI Search for Healthcare consente di creare rapidamente motori di ricerca ottimizzati in campo medico sui dati sanitari.

Ricerca nel settore sanitario 20,00 $ / 1000 query

Vertex AI Search for Healthcare include alcune funzionalità in anteprima come le risposte di GenAI, gli aggiornamenti in streaming all'indice e altre. Queste funzionalità potrebbero avere un prezzo diverso rispetto all'attuale prezzo indicato quando vengono rilasciate in disponibilità generale.

Ipotesi:

  • 1.000.000 di richieste di ricerca nel settore sanitario al mese

  • 1000 GiB di dati sanitari indicizzati

Volume SKU Frequenza Prezzo di listino totale
1.000.000 di ricerche 20 $/1000 20.000 $
1000 GiB 5 $ per GiB 5000 $

Prezzi di Vertex AI Search for Media

Vertex AI Search for Media ti consente di fornire risultati video altamente pertinenti, sfruttando le query di Google e la comprensione del contesto per migliorare la scoperta sul tuo sito multimediale.

Vertex AI Agent Builder: indice dati 5,00 $ / GB al mese
Vertex AI Search: conteggio delle richieste dell'API Media Search 2,00 $ / 1000 query

Prezzi di Vertex AI Search for Media Recommendations

Le uniche operazioni di suggerimento di contenuti multimediali che sono soggette ad addebiti sono l'addestramento, l'ottimizzazione o la richiesta di previsioni chiamando il metodo Recommend. Non è previsto alcun costo per l'importazione o la gestione degli eventi utente o delle informazioni dei documenti.

I costi di addestramento (per nodo all'ora) vengono addebitati su base giornaliera se il modello è in fase di addestramento o se hai inviato una richiesta per riprendere l'addestramento. Dopo aver messo in pausa o eliminato un modello, non ti verrà più addebitato alcun costo. Consulta la documentazione relativa alla gestione dell'addestramento.

I costi dell'ottimizzazione (per nodo all'ora) per i modelli attivi vengono addebitati una volta completata l'ottimizzazione. Ti viene addebitato un costo per un'ottimizzazione incompleta solo se metti in pausa o elimini un modello durante un'ottimizzazione in corso. In questo caso, ti verranno addebitate le ore nodo utilizzate prima dell'interruzione dell'ottimizzazione del modello. Consulta la documentazione per la gestione dell'ottimizzazione.

Richieste di previsioni al mese Prezzo per 1000 previsioni
Fino a 20.000.000 $ 0,27
Successivi 280.000.000 $ 0,18
Da 300.000.000 in su $ 0,10
Funzionalità Prezzo
Addestramento e ottimizzazione $ 2,50 per nodo all'ora

Esempio di prezzi per i suggerimenti sui contenuti multimediali

Ipotesi:

  • 1.000.000.000 di richieste di previsione al mese

  • Addestra un singolo modello al giorno, che viene riaddestrato automaticamente una volta al giorno

  • Corrisponde a circa 500 ore nodo di addestramento del modello e 100 ore di ottimizzazione del modello al mese

Volume SKU Frequenza Prezzo di listino totale
Primi 20 milioni di previsioni * $0,27 ogni 1000 previsioni = 5400 $
Prossimi 280 milioni di previsioni * $0,18 / 1000 previsioni = 50.400 $
Previsioni per i prossimi 700 milioni * $0,10 ogni 1000 previsioni = 70.000 $
500 ore nodo (addestramento) * $2,50 / ora = 1250 $
100 ore nodo (ottimizzazione) * $2,50 / ora = 250 $
Totale 127.300 $

Addebiti di Google Cloud Observability

Media Recommendations registra un errore in Google Cloud Observability per ogni richiesta API che comporta un errore, ad esempio una richiesta di evento utente che contiene JSON in formato non corretto, o una richiesta di importazione di documenti con un prezzo negativo. Inoltre, i suggerimenti di contenuti multimediali registrano un errore per ogni richiesta di previsione con un documento non incluso nel datastore importato.

Gli addebiti di Google Cloud Observability vengono calcolati in base ai GiB di log archiviati e per la conservazione oltre la data periodo di conservazione predefinito. Per maggiori dettagli sui l'allocazione gratuita e la conservazione dei dati, vedi la pagina dei prezzi di Google Cloud Observability.

La dimensione dei dati di logging dipende da quella del payload JSON, ma un GiB corrisponde a circa 200.000 errori di suggerimenti di contenuti multimediali.

Prezzi dell'API Grounded Generation

L'API Grounded Generation ti consente di creare risposte generative ai tuoi prompt utilizzando informazioni sulla Ricerca Google o i tuoi dati.

Prompt di inserimento (include prompt dell'utente, istruzioni di sistema e informazioni di grounding incorporate) Viene addebitato il prezzo del modello Gemini selezionato.
Output Viene addebitato il prezzo del modello Gemini selezionato.
Grounded Generation per basarsi sui dati recuperati 2,50 $ / 1000 richieste
Grounded Generation per basarsi sulla Ricerca Google Consulta la sezione Informazioni sulla Ricerca Google.
I costi aggiuntivi per il recupero dei dati sono determinati dal sistema di recupero selezionato (ad es. Vertex AI Search).

Esempio 1: grounding su Vertex AI Search e fatti di grounding incorporati

L'utente utilizza Vertex AI Search e altri fatti di base per generare risposte con grounding. Ogni prompt di input contiene 2500 caratteri (inclusi i fatti di grounding incorporati) e ogni prompt di output di 200 caratteri. L'utente ha selezionato Gemini 1.5 Flash.

Volume per richiesta Prezzo per 1000 richieste
Prompt di input 2500 caratteri 1000 richieste * 0,000125 $ per 1000 caratteri * 2500 caratteri per richiesta = 0,3125$per 1000 richieste
Output 200 caratteri 1000 richieste * 0,000375 $ per 1000 caratteri * 2 caratteri per richiesta = 0,075$per 1000 richieste
Grounded Generation per basarsi sui dati recuperati 1 richiesta 2,50$per 1000 richieste
Recupero dei dati: Vertex AI Search (versione Enterprise) 1 richiesta 4,00$per 1000 richieste
Totale: 6,8875 $ per 1000 richieste

L'utente utilizza la Ricerca Google per generare risposte fondate. Ogni prompt di input contiene 500 caratteri e ogni prompt di output ha una lunghezza di 200 caratteri. L'utente ha selezionato Gemini 1.5 Flash.

Volume per richiesta Prezzo per 1000 richieste
Prompt di input 500 caratteri 1000 richieste * 0,000125 $ per 1000 caratteri * 500 caratteri per richiesta = 0,0625$per 1000 richieste
Output 200 caratteri 1000 richieste * 0,000375 $ per 1000 caratteri * 200 caratteri per richiesta = 0,075$per 1000 richieste
Grounded Generation per basarsi sulla Ricerca Google 1 richiesta 35,00$per 1000 richieste
Totale: 35,1375 $ per 1000 richieste

Controlla i prezzi dell'API di grounding

L'opzione Verifica grounding consente di determinare la posizione di un testo (il candidato della risposta) in un determinato insieme di testi di riferimento (i fatti).

Controlla messa a terra 0,00075 $ ogni 1000 caratteri di risposta

Prezzi delle funzionalità di Document AI

Per informazioni complete sui prezzi di tutte le funzionalità di Document AI, consulta la pagina dei prezzi di Document AI.

Per le funzionalità di Document AI integrate e fatturate tramite Vertex AI Search, consulta le tabelle riportate di seguito.

Digitalizza il testo

Processore 1 - 5.000.000 pagine/mese * Oltre 5.000.001 di pagine al mese
Processore OCR di documenti aziendali 1,50 $ ogni 1.000 pagine 0,60 $ ogni 1000 pagine

Estrai strutture ed entità dai documenti

Analizzatore del layout (include il chunking iniziale) 10 $ ogni 1.000 pagine

*Le dimensioni di una pagina dipendono dal formato file:

  • Immagini (JPEG/JPG, PNG, BMP, HEIF): ogni immagine = 1 pagina

  • PDF: ogni pagina del PDF = 1 pagina

  • TIFF: ogni immagine nel TIFF = 1 pagina.

  • Word (DOCX): Fino a 3.000 caratteri = 1 pagina

  • Excel (XLSX): ogni scheda = 1 pagina

  • PowerPoint (PPTX): ogni slide = 1 pagina

  • HTML: fino a 3000 caratteri = 1 pagina

  • Documenti analizzati: fino a 3000 caratteri = 1 pagina

Ranking dei prezzi delle API

L'API di ranking prende un elenco di documenti e li classifica in base alla pertinenza rispetto a una query.

Rispetto agli incorporamenti, che esaminano solo la somiglianza semantica di un documento e di una query, l'API di ranking può fornire punteggi precisi per quanto riguarda la risposta di un documento a una determinata query.

L'API di ranking può essere utilizzata per migliorare la qualità dei risultati di ricerca dopo aver recuperato un insieme iniziale di documenti candidati.

Ranking dei documenti

Ranking 1 $ per 1000 query

Per query si intende avere fino a 100 documenti, sebbene un utente possa specificare più di 100 documenti per query. Nel caso in cui vengano specificati più di 100 documenti, il prezzo aumenta di 1 per ogni multiplo di 100 documenti.
Ad esempio:

  • 132 documenti da classificare = 2 query

  • 200 documenti da classificare = 2 query

  • 399 documenti da classificare = 4 query

  • 401 documenti da classificare = 5 query

Passaggi successivi

Richiedi un preventivo personalizzato

Con i prezzi con pagamento a consumo di Google Cloud, paghi solo per i servizi che utilizzi. Per ricevere un preventivo personalizzato per la tua organizzazione, contatta il nostro team di vendita.
Contatta il team di vendita