Prezzi di Vertex AI Agent Builder

I prezzi sono indicati in dollari statunitensi (USD).

I prezzi delle funzionalità in disponibilità generale (GA) elencate vengono richiamati il 1° settembre 2023.

Vertex AI Agent Builder consente agli sviluppatori, anche quelli con competenze limitate di machine learning, di sfruttare la potenza dei modelli linguistici di grandi dimensioni (LLM), delle competenze di ricerca e delle tecnologie di IA conversazionale di base di Google per creare applicazioni di IA generativa di livello enterprise.

Crediti e assistenza per la prova

Vengono assegnati 1000$ di crediti di prova GRATUITI per l'utilizzo con Vertex AI Agent Builder. Questi crediti sono validi per un periodo di 1 anno a partire dalla registrazione dell'account con Vertex AI Agent Builder a partire dal 18 luglio 2023.

Hai domande sulla funzionalità GA o sulla confezione e sui prezzi delle funzionalità in anteprima?

Per ulteriori informazioni, contatta il team di vendita di Google Cloud .

Prezzi di Vertex AI Agents

Vertex AI Agent Builder offre la possibilità di creare rapidamente agenti virtuali (chatbot) che generano risposte in base ai contenuti (sito web, documenti) inclusi nei datastore. Utilizzando gli Agenti Vertex AI, puoi creare un nuovo agente virtuale Dialogflow CX OPPURE aggiungere la funzionalità a un agente virtuale Dialogflow CX esistente.

Per aggiungere ulteriori funzionalità di AI generativa agli agenti virtuali Dialogflow CX, puoi sfruttare i rilasci generati, che utilizzano un modello linguistico di grandi dimensioni (LLM) per gestire agevolmente scenari in cui non esiste alcuna corrispondenza con l'intento dell'utente. I generatori consentono agli sviluppatori di bot di inserire azioni generative in qualsiasi punto del flusso conversazionale, ad esempio per riassumere una conversazione, personalizzare un'interazione o concatenare più chiamate LLM per creare un intero flusso di lavoro generativo.

Prezzi per la funzionalità GA di Vertex AI Agents

Chat di Vertex AI Agents* 12,00 $ / 1000 query**
Voce di Vertex AI Agents* 0,002 $ al secondo†
Dialogflow CX Chat***(funzionalità standard, di IA non generativa per Chat) 7,00 $ / 1000 query**
Dialogflow CX Voice***(Funzionalità standard, di IA non generativa per Voice) 0,001 $ al secondo†
* Tutte le funzionalità di IA generativa: gli agenti di datastore, i fallback generativi, i generatori e le app Agent sono coperti dai prezzi degli SKU di Chat e Voice di Vertex AI. Se utilizzi più tipi di funzionalità di IA generativa in una singola richiesta, ti verrà addebitato separatamente il costo di ogni funzionalità in base al suo utilizzo.

* I clienti possono combinare query al secondo di Dialogflow CX (non generativa) e di agenti Vertex AI (generativi) nello stesso agente o flusso e gli verrà addebitato automaticamente l'utilizzo effettivo di ciascun set di funzionalità. In questo modo, puoi sfruttare selettivamente AI generativa, ove applicabile, e pagare solo per ciò che effettivamente utilizzi.

**Richiesta (o query): fatturazione misurata per singola richiesta o query.
Per richiesta o query si intende qualsiasi chiamata API al servizio Dialogflow o al servizio Vertex AI Agents, diretta tramite l'utilizzo dell'API o indiretta tramite l'integrazione o la console.
Ad esempio, un utente che fa una domanda a un agente virtuale (chatbot) e il chatbot risponde è 1 Richiesta. Un'interazione dell'utente con il chatbot può essere composta da più richieste per svolgere un'attività.

† Include riconoscimento vocale, conversione della voce in testo (STT), sintesi vocale, sintesi vocale (TTS) e telefonia. La durata totale dell'elaborazione audio fatturata è indipendente da qualsiasi elaborazione senza costi e non audio (latenza API, elaborazione webhook e così via) che può verificarsi prima, durante o dopo l'elaborazione audio.

* Dialogflow CX Chat e Dialogflow CX Voice non sono idonei per i crediti di prova GRATUITI di 1000 $. Dialogflow CX offre un programma di crediti di prova aggiuntivo che può essere combinato con questo programma di crediti di prova GRATUITO di Vertex AI Agent Builder. Consulta le definizioni aggiuntive della misurazione di Dialogflow CX qui.

Esempio di prezzi per la funzionalità GA di Vertex AI Agents

Esempio di combinazione di risposte basate sull'intenzione e generative: assistenza clienti sul sito web

  • Vengono utilizzati flussi deterministici basati sull'intenzione per alcune domande specifiche del cliente (fatturazione, pagamento)
  • Risposte generative utilizzate per gestire domande in cui non viene definito alcun intento, ma la risposta è presente sul sito web

Ipotesi:

  • 100 Mln di visite annuali al sito web
  • Il 5% dei visitatori utilizza il chatbot, 3 query per utilizzo, il 50% generativo, il 50% basato sull'intenzione
Volume SKU Frequenza Prezzo di listino totale
Chat Dialogflow CX (basata su intent)
7,5 milioni all'anno
100 milioni*5% di utilizzo*3 query*50% basate sull'intenzione
* $7,00 / 1000 query = 52.500 $
Dialogflow CX Enterprise Chat (generativa)
7,5 milioni all'anno
100 milioni*5% di utilizzo*3 query*50% generativo
* $12,00 / 1000 query = 90.000 $
Dati indicizzati
50 GB all'anno
10 GB gratuiti, quindi 40 GB utilizzati nel calcolo del prezzo
* 5,00 $ / GB * 12 mesi = 2400 $

Prezzi di Vertex AI Search

Vertex AI Agent Builder offre la possibilità di creare rapidamente motori di ricerca per siti web, dati non strutturati e dati strutturati per recuperare informazioni e generare risposte fondate. Puoi scoprire di più sulle funzionalità disponibili in Vertex AI Search.

Prezzi per la funzionalità GA di Vertex AI Search

Versione standard della rete di ricerca 2,00 $ / 1000 query
Ricerca Enterprise Edition 4,00 $ / 1000 query
Componente aggiuntivo LLM
(può essere aggiunto sia a Standard Edition che a Enterprise Edition)
Di base +4,00 $ / 1000 query di input utente
Avanzato +10,00 $ / 1000 query di input utente
di Search Enterprise al posto di Ricerca Versione standard Versione standard Versione standard di Ricerca Funzionalità di ricerca semplice Google Search Enterprise Edition più funzionalità di ricerca semplice o funzionalità di ricerca Descrizione Google Search Enterprise Edition più query query di ricerca Google Search Enterprise Edition più query risposte più risposte risposte risposte semplifica la query di ricerca versione query risposte risposte risposte risposte risposte risposte semplifica se risposte risposte risposte risposte risposte risposte risposte risposte risposte risposte on se risposte risposte risposte risposte risposte risposte risposte risposte risposte risposte as generare risposte risposte risposte risposte risposte risposte risposte e risposte e conversioni di semplici query semplici o semplici query a singola/in multi-turno o multi-turno singola query, con la possibilità di elaborare query semplici query composte da query composte o query lunghe, query composte o query lunghe, query che eseguono query con supporto del supporto



Gli addebiti vengono effettuati in base al numero di query input utente, non in base al numero di hop
Anteprima privata - Ricerca strutturata + nuove funzionalità di IA generativa (contatta il team di vendita per le funzionalità più recenti)

Query: fatturazione misurata per singola richiesta o input di query
Per richiesta o query si intende qualsiasi chiamata API a Enterprise Search, diretta con l'utilizzo dell'API o indiretta con l'integrazione o la console.
Ad esempio, quando un utente pone una domanda in linguaggio naturale e il motore di ricerca risponde con una sola query.

Il componente aggiuntivo LLM viene aggiunto a una query per aumentare l'elaborazione e utilizzare una funzionalità di IA generativa.
Il componente aggiuntivo LLM può essere utilizzato in modo intercambiabile con Search Standard Edition o Search Enterprise Edition.
Esempio: esecuzione di una query Search Enterprise con una richiesta di riassunto = 1 query Search Enterprise + 1 query di componente aggiuntivo LLM

Esempio di prezzi per la funzionalità GA di Vertex AI Search

Esempio di dati non strutturati : ricerca documenti

Ipotesi:

  • 10 milioni di query della versione Standard all'anno
  • 10 milioni di query Enterprise Edition con 10 milioni di query di riepilogo LLM all'anno
  • 100.000 documenti a ~1 MB ciascuno
Volume SKU Frequenza Prezzo di listino totale
Ricerca standard
10 milioni all'anno * $2,00 / 1000 query = 20.000 $
Ricerca aziendale
10 milioni all'anno * $4,00 / 1000 query = $ 40.000
Componente aggiuntivo LLM ricerca di base
Ogni query aggiunta a una query Standard o Enterprise
10 milioni all'anno * +$4,00 ogni 1000 query di input utente = OLTRE 40.000 $
Componente aggiuntivo LLM di ricerca avanzata
Ogni query aggiunta a una query Standard o Enterprise
10 milioni all'anno * +$10,00 / 1000 query di input utente = OLTRE 100.000 $
Dati indicizzati
100 GB all'anno 10 GB gratuiti, quindi 90 GB utilizzati nel calcolo del prezzo * 5,00 $ / GB * 12 mesi = 5400 $

Prezzi di Data Index

Prezzi per l'archiviazione dei dati dell'indice di Vertex AI Agent Builder

Dati indicizzati 5,00 $ per GiB al mese
* Quota gratuita di 10 GiB fornita
** Condiviso su Vertex AI Agent Builder
*** Lo spazio di archiviazione è calcolato come 500 kibibyte (KiB) * "numero di pagine sul sito web", dove 1 KiB è 1024 byte. (500 KiB corrispondono a ~0,000477 GiB, quindi l'indicizzazione il prezzo per un sito web di 1000 pagine è di $2,38 al mese.)

Prezzi di Vertex AI Search for Healthcare

Vertex AI Search for Healthcare consente di creare rapidamente motori di ricerca ottimizzati in campo medico sui dati sanitari.

Ricerca nel settore sanitario 20,00 $ / 1000 query

Vertex AI Search for Healthcare include alcune funzionalità in anteprima come le risposte di GenAI, gli aggiornamenti in streaming all'indice e altre. Queste funzionalità potrebbero avere un prezzo diverso rispetto all'attuale prezzo indicato quando vengono rilasciate in disponibilità generale.

Ipotesi:

  • 1.000.000 di richieste di ricerca nel settore sanitario al mese

  • 1000 GiB di dati sanitari indicizzati

Volume SKU Frequenza Prezzo di listino totale
1.000.000 di ricerche 20 $/1000 20.000 $
1000 GiB 5 $ per GiB 5000 $

Prezzi di Vertex AI Search for Media

Vertex AI Search for Media ti consente di fornire risultati video altamente pertinenti, sfruttando le query di Google e la comprensione del contesto per migliorare la scoperta sul tuo sito multimediale.

Vertex AI Agent Builder: indice dati 5,00 $ / GB al mese
Vertex AI Search: conteggio delle richieste dell'API Media Search 2,00 $ / 1000 query

Prezzi di Vertex AI Search for Media Recommendations

Le uniche operazioni di suggerimento contenuti multimediali che sono soggette ad addebiti sono l'addestramento, l'ottimizzazione o la richiesta di previsioni chiamando il metodo Recommend. Non è previsto alcun costo per l'importazione o la gestione degli eventi utente o delle informazioni dei documenti.

I costi di addestramento (per nodo all'ora) vengono addebitati su base giornaliera se il modello è in fase di addestramento o se hai inviato una richiesta per riprendere l'addestramento. Dopo aver messo in pausa o eliminato un modello, non ti verrà più addebitato alcun costo. Consulta la documentazione relativa alla gestione dell'addestramento.

I costi dell'ottimizzazione (per nodo all'ora) per i modelli attivi vengono addebitati una volta completata l'ottimizzazione. Ti viene addebitato un costo per un'ottimizzazione incompleta solo se metti in pausa o elimini un modello durante un'ottimizzazione in corso. In questo caso, ti verranno addebitate le ore nodo utilizzate prima dell'interruzione dell'ottimizzazione del modello. Consulta la documentazione per la gestione dell'ottimizzazione.

Richieste di previsioni al mese Prezzo per 1000 previsioni
Fino a 20.000.000 $ 0,27
Successivi 280.000.000 $ 0,18
Da 300.000.000 in su $ 0,10
Funzionalità Prezzo
Addestramento e ottimizzazione $ 2,50 per nodo all'ora

Esempio di prezzi per i suggerimenti sui contenuti multimediali

Ipotesi:

  • 1.000.000.000 di richieste di previsione al mese

  • Addestra un singolo modello al giorno, che viene riaddestrato automaticamente una volta al giorno

  • Corrisponde a circa 500 ore nodo di addestramento del modello e 100 ore di ottimizzazione del modello al mese

Volume SKU Frequenza Prezzo di listino totale
Primi 20 milioni di previsioni * $0,27 ogni 1000 previsioni = 5400 $
Prossimi 280 milioni di previsioni * $0,18 / 1000 previsioni = 50.400 $
Previsioni per i prossimi 700 milioni * $0,10 ogni 1000 previsioni = 70.000 $
500 ore nodo (addestramento) * $2,50 / ora = 1250 $
100 ore nodo (ottimizzazione) * $2,50 / ora = 250 $
Totale 127.300 $

Addebiti di Google Cloud Observability

Media Recommendations registra un errore in Google Cloud Observability per ogni richiesta API che genera un errore, ad esempio una richiesta di evento utente contenente JSON in formato non valido o una richiesta di importazione di documenti con un prezzo negativo. Inoltre, i suggerimenti di contenuti multimediali registrano un errore per ogni richiesta di previsione con un documento non presente nel datastore importato.

Google Cloud Observability addebita i costi in base ai GiB dei log archiviati e per la conservazione oltre il periodo di conservazione predefinito. Per maggiori dettagli sull'allocazione gratuita e sulla conservazione dei dati, consulta la pagina dei prezzi di Google Cloud Observability.

La dimensione dei dati di logging dipende da quella del payload JSON, ma un GiB corrisponde a circa 200.000 errori di suggerimenti di contenuti multimediali.

Prezzi dell'API Grounded Generation

L'API Grounded Generation ti consente di creare risposte generative ai tuoi prompt utilizzando informazioni sulla Ricerca Google o i tuoi dati.

Prompt di inserimento (include prompt dell'utente, istruzioni di sistema e informazioni di grounding incorporate) Viene addebitato il prezzo del modello Gemini selezionato.
Output Viene addebitato il prezzo del modello Gemini selezionato.
Grounded Generation per basarsi sui dati recuperati 2,50 $ / 1000 richieste
Grounded Generation per basarsi sulla Ricerca Google Consulta la sezione Informazioni sulla Ricerca Google.
I costi aggiuntivi per il recupero dei dati sono determinati dal sistema di recupero selezionato (ad es. Vertex AI Search).

Esempio 1: grounding su Vertex AI Search e fatti di grounding incorporati

L'utente utilizza Vertex AI Search e altri fatti di base per generare risposte con grounding. Ogni prompt di input contiene 2500 caratteri (inclusi i fatti di grounding incorporati) e ogni prompt di output di 200 caratteri. L'utente ha selezionato Gemini 1.5 Flash.

Volume per richiesta Prezzo per 1000 richieste
Prompt di input 2500 caratteri 1000 richieste * 0,000125 $ per 1000 caratteri * 2500 caratteri per richiesta = 0,3125$per 1000 richieste
Output 200 caratteri 1000 richieste * 0,000375 $ per 1000 caratteri * 2 caratteri per richiesta = 0,075$per 1000 richieste
Grounded Generation per basarsi sui dati recuperati 1 richiesta 2,50$per 1000 richieste
Recupero dei dati: Vertex AI Search (versione Enterprise) 1 richiesta 4,00$per 1000 richieste
Totale: 6,8875 $ per 1000 richieste

L'utente utilizza la Ricerca Google per generare risposte fondate. Ogni prompt di input contiene 500 caratteri e ogni prompt di output ha una lunghezza di 200 caratteri. L'utente ha selezionato Gemini 1.5 Flash.

Volume per richiesta Prezzo per 1000 richieste
Prompt di input 500 caratteri 1000 richieste * 0,000125 $ per 1000 caratteri * 500 caratteri per richiesta = 0,0625$per 1000 richieste
Output 200 caratteri 1000 richieste * 0,000375 $ per 1000 caratteri * 200 caratteri per richiesta = 0,075$per 1000 richieste
Grounded Generation per basarsi sulla Ricerca Google 1 richiesta 35,00$per 1000 richieste
Totale: 35,1375 $ per 1000 richieste

Controlla i prezzi dell'API di grounding

L'opzione Verifica grounding consente di determinare la natura di un testo (il candidato della risposta) in un determinato insieme di testi di riferimento (i fatti).

Controlla messa a terra 0,00075 $ ogni 1000 caratteri di risposta

Prezzi delle funzionalità di Document AI

Per informazioni complete sui prezzi di tutte le funzionalità di Document AI, consulta la pagina dei prezzi di Document AI.

Per le funzionalità di Document AI integrate e fatturate tramite Vertex AI Search, consulta le tabelle riportate di seguito.

Digitalizza il testo

Processore 1 - 5.000.000 pagine/mese * Oltre 5.000.001 di pagine al mese
Processore OCR di documenti aziendali 1,50 $ ogni 1.000 pagine 0,60 $ ogni 1000 pagine

Estrai strutture ed entità dai documenti

Analizzatore del layout (include il chunking iniziale) 10 $ ogni 1.000 pagine

*Le dimensioni di una pagina dipendono dal formato file:

  • Immagini (JPEG/JPG, PNG, BMP, HEIF): ogni immagine = 1 pagina

  • PDF: ogni pagina del PDF = 1 pagina

  • TIFF: ogni immagine nel TIFF = 1 pagina.

  • Word (DOCX): Fino a 3.000 caratteri = 1 pagina

  • Excel (XLSX): ogni scheda = 1 pagina

  • PowerPoint (PPTX): ogni slide = 1 pagina

  • HTML: fino a 3000 caratteri = 1 pagina

  • Documenti analizzati: fino a 3000 caratteri = 1 pagina

Ranking dei prezzi delle API

L'API di ranking prende un elenco di documenti e li classifica in base alla pertinenza rispetto a una query.

Rispetto agli incorporamenti, che esaminano solo la somiglianza semantica di un documento e di una query, l'API di ranking può fornire punteggi precisi per quanto riguarda la risposta di un documento a una determinata query.

L'API di ranking può essere utilizzata per migliorare la qualità dei risultati di ricerca dopo aver recuperato un insieme iniziale di documenti candidati.

Ranking dei documenti

Classifica 1 $ per 1000 query

Per query si intende con un massimo di 100 documenti, sebbene un utente possa specificare più di 100 documenti per query. Nel caso in cui vengano specificati più di 100 documenti, il prezzo aumenta di 1 per ogni multiplo di 100 documenti.
Ad esempio:

  • 132 documenti da classificare = 2 query

  • 200 documenti da classificare = 2 query

  • 399 documenti da classificare = 4 query

  • 401 documenti da classificare = 5 query

Passaggi successivi

Richiedi un preventivo personalizzato

Con i prezzi con pagamento a consumo di Google Cloud, paghi solo per i servizi che utilizzi. Per ricevere un preventivo personalizzato per la tua organizzazione, contatta il nostro team di vendita.
Contatta il team di vendita