A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina descrive i prezzi e la fatturazione di Vertex AI RAG Engine in base ai componenti di Vertex AI RAG Engine che utilizzi, come modelli, ranking e archiviazione vettoriale.
L'utilizzo di Vertex AI RAG Engine è gratuito. Tuttavia, se configuri
i componenti di Vertex AI RAG Engine, la fatturazione potrebbe essere interessata.
Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.
Componente
Come funziona la fatturazione con Vertex AI RAG Engine
Vertex AI RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da Vertex AI RAG Engine è gratuito, ma queste origini dati potrebbero addebitare un costo per il trasferimento dei dati. Ad esempio, i costi per il traffico in uscita dei dati.
Parser LLM: Vertex AI RAG Engine utilizza il modello LLM che hai specificato per analizzare il file e visualizzerai e pagherai i costi del modello LLM direttamente dal tuo progetto.
Analizzatore del layout di Document AI: il motore RAG di Vertex AI utilizza l'analizzatore del layout di Document AI che hai specificato per elaborare il file e vedrai e pagherai l'utilizzo dell'analizzatore del layout di Document AI direttamente dal tuo progetto.
Vertex AI RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello.
RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale:
Database gestito da RAG
Bring Your Own vector database
Un database gestito da RAG ha due scopi:
Un database gestito dalla RAG
memorizza le risorse RAG, come i corpora RAG e i file RAG. I contenuti dei file
sono esclusi.
A tua scelta, indicizzazione e recupero degli incorporamenti per la ricerca vettoriale.
Un database gestito dalla RAG utilizza un'istanza Spanner come backend.
Per ogni progetto, Vertex AI RAG Engine
provisiona un progetto Google Cloud specifico per il cliente e gestisce
le risorse gestite da RAG archiviate in
Vertex AI RAG Engine, in modo che i tuoi dati siano fisicamente
isolati.
Se scegli il livello RagManagedDB Basic
o Scaled, Vertex AI RAG Engine esegue il provisioning di un'istanza
di Spanner Enterprise Edition nel progetto
corrispondente:
Livello Basic: 100 unità di elaborazione con backup
Livello scalato: a partire da 1 nodo (1000 unità di elaborazione) e
scalabilità automatica fino a 10 nodi con backup
Se uno dei corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza Spanner gestita da RAG.
Vertex AI RAG Engine mostra i costi di Spanner dal progetto corrispondente gestito da RAG al tuo progetto Google Cloud , in modo che tu possa visualizzare e pagare i costi dell'istanza Spanner.
Per ulteriori dettagli sui prezzi di Spanner, consulta la pagina Prezzi di Spanner.
I seguenti strumenti di classificazione sono supportati dopo il recupero:
LLM Reranker: Vertex AI RAG Engine utilizza il
modello LLM che hai specificato per riordinare i risultati del recupero e
vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto.
API Vertex AI Search Ranking:
Il motore RAG di Vertex AI utilizza l'API
Vertex AI Search Ranking per riordinare i risultati
del recupero e vedrai e pagherai l'API Ranking direttamente dal tuo progetto.
Passaggi successivi
Per scoprire come utilizzare l'SDK Vertex AI per eseguire
le attività di Vertex AI RAG Engine, consulta la guida rapida di RAG per
Python.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]