Questa pagina descrive i prezzi e la fatturazione di Vertex AI RAG Engine in base ai componenti di Vertex AI RAG Engine che utilizzi, come modelli, ranking e archiviazione vettoriale.
Per ulteriori informazioni, consulta la pagina Panoramica di Vertex AI RAG Engine.
Prezzi e fatturazione
L'utilizzo di Vertex AI RAG Engine è gratuito. Tuttavia, se configuri i componenti di Vertex AI RAG Engine, la fatturazione potrebbe essere interessata.
Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.
Componente | Come funziona la fatturazione con Vertex AI RAG Engine |
---|---|
Importazione dati | Vertex AI RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da Vertex AI RAG Engine è gratuito, ma queste origini dati potrebbero addebitare un costo per il trasferimento dei dati. Ad esempio, i costi per il traffico in uscita dei dati. |
Trasformazione dei dati (analisi dei file) |
|
Trasformazione dei dati (divisione dei file in blocchi) | Supporta la suddivisione in blocchi di dimensioni fisse, che è gratuita. |
Generazione di embedding | Vertex AI RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello. Per ulteriori informazioni sui prezzi, consulta Costo di creazione e deployment di modelli di AI in Vertex AI. |
Indicizzazione e recupero dei dati |
RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale:
Un database gestito da RAG ha due scopi:
Un database gestito dalla RAG utilizza un'istanza Spanner come backend. Per ogni progetto, Vertex AI RAG Engine provisiona un progetto Google Cloud specifico per il cliente e gestisce le risorse gestite da RAG archiviate in Vertex AI RAG Engine, in modo che i tuoi dati siano fisicamente isolati. Se scegli il livello
Se uno dei corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza Spanner gestita da RAG. Vertex AI RAG Engine mostra i costi di Spanner dal progetto corrispondente gestito da RAG al tuo progetto Google Cloud , in modo che tu possa visualizzare e pagare i costi dell'istanza Spanner. Per ulteriori dettagli sui prezzi di Spanner, consulta la pagina Prezzi di Spanner. |
Reranking per Vertex AI RAG Engine | I seguenti strumenti di classificazione sono supportati dopo il recupero:
|
Passaggi successivi
- Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di Vertex AI RAG Engine, consulta la guida rapida di RAG per Python.
- Per scoprire di più sul grounding, consulta la panoramica del grounding.
- Per saperne di più sulle risposte di RAG, consulta Output di recupero e generazione del motore RAG di Vertex AI.
- Per scoprire di più sull'architettura RAG: