Questa pagina è stata tradotta dall'API Cloud Translation.

Fatturazione di Vertex AI RAG Engine

Questa pagina descrive i prezzi e la fatturazione di Vertex AI RAG Engine in base ai componenti di Vertex AI RAG Engine che utilizzi, come modelli, ranking e archiviazione vettoriale.

Per ulteriori informazioni, consulta la pagina Panoramica del motore RAG di Vertex AI.

Prezzi e fatturazione

L'utilizzo di Vertex AI RAG Engine è gratuito. Tuttavia, se configuri i componenti di Vertex AI RAG Engine, la fatturazione potrebbe essere interessata.

Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.

Componente	Come funziona la fatturazione con Vertex AI RAG Engine
Importazione dati	Vertex AI RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da Vertex AI RAG Engine è gratuito, ma queste origini dati potrebbero addebitare un costo per il trasferimento dei dati. Ad esempio, i costi per il traffico in uscita dei dati.
Trasformazione dei dati (analisi dei file)	Parser predefinito: gratuito. Parser LLM: Vertex AI RAG Engine utilizza il modello LLM che hai specificato per analizzare il file e visualizzerai e pagherai i costi del modello LLM direttamente dal tuo progetto. Analizzatore del layout di Document AI: il motore RAG di Vertex AI utilizza l'analizzatore del layout di Document AI che hai specificato per elaborare il file e vedrai e pagherai l'utilizzo dell'analizzatore del layout di Document AI direttamente dal tuo progetto.
Trasformazione dei dati (suddivisione dei file)	Supporta la suddivisione in blocchi di dimensioni fisse, che è gratuita.
Generazione di embedding	Vertex AI RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello. Per ulteriori informazioni sui prezzi, consulta Costo di creazione e deployment di modelli di AI in Vertex AI.
Indicizzazione e recupero dei dati	RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale: Database gestito da RAG Bring Your Own Vector Database Un database gestito da RAG ha due scopi: Un database gestito dalla RAG memorizza le risorse RAG, come i corpora RAG e i file RAG. I contenuti dei file sono esclusi. A tua scelta, indicizzazione e recupero degli incorporamenti per la ricerca vettoriale. Un database gestito dalla RAG utilizza un'istanza Spanner come backend. Per ogni progetto, Vertex AI RAG Engine provisiona un progetto Google Cloud specifico per il cliente e gestisce le risorse gestite da RAG archiviate in Vertex AI RAG Engine, in modo che i tuoi dati siano fisicamente isolati. Se scegli il livello `RagManagedDB` Basic o Scaled, Vertex AI RAG Engine esegue il provisioning di un'istanza Spanner Enterprise Edition nel progetto corrispondente: Livello Basic: 100 unità di elaborazione con backup Livello scalato: a partire da 1 nodo (1000 unità di elaborazione) e scalabilità automatica fino a 10 nodi con backup Se uno dei corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza Spanner gestita da RAG. Vertex AI RAG Engine mostra i costi di Spanner dal progetto corrispondente gestito da RAG al tuo progetto Google Cloud , in modo che tu possa visualizzare e pagare i costi dell'istanza Spanner. Per ulteriori dettagli sui prezzi di Spanner, consulta la pagina Prezzi di Spanner.
Reranking per Vertex AI RAG Engine	I seguenti strumenti di classificazione sono supportati dopo il recupero: LLM Reranker: Vertex AI RAG Engine utilizza il modello LLM che hai specificato per riordinare i risultati del recupero e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto. API Vertex AI Search Ranking: Il motore RAG di Vertex AI utilizza l'API Vertex AI Search Ranking per riordinare i risultati del recupero e vedrai e pagherai l'API Ranking direttamente dal tuo progetto.

Elimina Vertex AI RAG Engine

I seguenti esempi di codice mostrano come eliminare un motore Vertex AI RAG per la console Google Cloud , Python e REST:

Parametri dell'API versione 1 (v1) e esempi di codice.
Parametri dell'API v1beta1 e esempi di codice.

Passaggi successivi

Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di Vertex AI RAG Engine, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la panoramica del grounding.
Per saperne di più sulle risposte di RAG, consulta Output di recupero e generazione del motore RAG di Vertex AI.
Per scoprire di più sull'architettura RAG:
- Infrastruttura per un'applicazione di AI generativa compatibile con RAG utilizzando Vertex AI e Vector Search
- Infrastruttura per un'applicazione di AI generativa compatibile con RAG utilizzando Vertex AI e AlloyDB per PostgreSQL.