Fatturazione di Vertex AI RAG Engine

Questa pagina descrive i prezzi e la fatturazione di Vertex AI RAG Engine in base ai componenti di Vertex AI RAG Engine che utilizzi, come modelli, ranking e archiviazione vettoriale.

Per ulteriori informazioni, consulta la pagina Panoramica di Vertex AI RAG Engine.

Prezzi e fatturazione

L'utilizzo di Vertex AI RAG Engine è gratuito. Tuttavia, se configuri i componenti di Vertex AI RAG Engine, la fatturazione potrebbe essere interessata.

Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.

Componente Come funziona la fatturazione con Vertex AI RAG Engine
Importazione dati Vertex AI RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da Vertex AI RAG Engine è gratuito, ma queste origini dati potrebbero addebitare un costo per il trasferimento dei dati. Ad esempio, i costi per il traffico in uscita dei dati.
Trasformazione dei dati (analisi dei file)
  • Parser predefinito: gratuito.
  • Parser LLM: Vertex AI RAG Engine utilizza il modello LLM che hai specificato per analizzare il file e visualizzerai e pagherai i costi del modello LLM direttamente dal tuo progetto.
  • Analizzatore del layout di Document AI: il motore RAG di Vertex AI utilizza l'analizzatore del layout di Document AI che hai specificato per elaborare il file e vedrai e pagherai l'utilizzo dell'analizzatore del layout di Document AI direttamente dal tuo progetto.
Trasformazione dei dati (divisione dei file in blocchi) Supporta la suddivisione in blocchi di dimensioni fisse, che è gratuita.
Generazione di embedding Vertex AI RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello.

Per ulteriori informazioni sui prezzi, consulta Costo di creazione e deployment di modelli di AI in Vertex AI.

Indicizzazione e recupero dei dati RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale:
  • Database gestito da RAG
  • Bring Your Own vector database

Un database gestito da RAG ha due scopi:
  • Un database gestito dalla RAG memorizza le risorse RAG, come i corpora RAG e i file RAG. I contenuti dei file sono esclusi.
  • A tua scelta, indicizzazione e recupero degli incorporamenti per la ricerca vettoriale.

Un database gestito dalla RAG utilizza un'istanza Spanner come backend.

Per ogni progetto, Vertex AI RAG Engine provisiona un progetto Google Cloud specifico per il cliente e gestisce le risorse gestite da RAG archiviate in Vertex AI RAG Engine, in modo che i tuoi dati siano fisicamente isolati.

Se scegli il livello RagManagedDB Basic o Scaled, Vertex AI RAG Engine esegue il provisioning di un'istanza di Spanner Enterprise Edition nel progetto corrispondente:

  • Livello Basic: 100 unità di elaborazione con backup
  • Livello scalato: a partire da 1 nodo (1000 unità di elaborazione) e scalabilità automatica fino a 10 nodi con backup

Se uno dei corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza Spanner gestita da RAG.

Vertex AI RAG Engine mostra i costi di Spanner dal progetto corrispondente gestito da RAG al tuo progetto Google Cloud , in modo che tu possa visualizzare e pagare i costi dell'istanza Spanner.

Per ulteriori dettagli sui prezzi di Spanner, consulta la pagina Prezzi di Spanner.

Reranking per Vertex AI RAG Engine I seguenti strumenti di classificazione sono supportati dopo il recupero:
  • LLM Reranker: Vertex AI RAG Engine utilizza il modello LLM che hai specificato per riordinare i risultati del recupero e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto.
  • API Vertex AI Search Ranking: Il motore RAG di Vertex AI utilizza l'API Vertex AI Search Ranking per riordinare i risultati del recupero e vedrai e pagherai l'API Ranking direttamente dal tuo progetto.

Passaggi successivi