Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Cette page décrit la tarification et la facturation du moteur RAG Vertex AI en fonction des composants que vous utilisez, tels que les modèles, le reranking et le stockage vectoriel.
Le moteur RAG Vertex AI permet d'ingérer des données provenant de différentes sources de données. Par exemple, l'importation de fichiers locaux, Cloud Storage et Google Drive. L'accès aux fichiers de ces sources de données à partir du moteur RAG Vertex AI est gratuit, mais ces sources de données peuvent facturer le transfert de données. Par exemple, les coûts de sortie des données.
Analyseur LLM : le moteur RAG Vertex AI utilise le modèle LLM que vous avez spécifié pour analyser votre fichier. Vous verrez et paierez les coûts du modèle LLM directement depuis votre projet.
Analyseur de mise en page Document AI : le moteur RAG Vertex AI utilise l'analyseur de mise en page Document AI que vous avez spécifié pour traiter votre fichier. Vous verrez et paierez l'utilisation de l'analyseur de mise en page Document AI directement depuis votre projet.
Le moteur RAG Vertex AI orchestre la génération d'embeddings à l'aide du modèle d'embedding que vous avez spécifié. Les coûts associés à ce modèle sont facturés à votre projet.
Le moteur RAG est compatible avec deux catégories de bases de données vectorielles pour la recherche vectorielle :
Base de données gérée par RAG
Utiliser votre propre base de données vectorielle
Une base de données gérée par RAG a deux objectifs :
Une base de données gérée par RAG stocke les ressources RAG, telles que les corpus et les fichiers RAG. Le contenu des fichiers est exclu.
Indexation et récupération des embeddings pour la recherche vectorielle, selon votre choix.
Une base de données gérée par RAG utilise une instance Spanner comme backend.
Pour chacun de vos projets, le moteur RAG Vertex AI provisionne un projet Google Cloud spécifique au client et gère les ressources gérées par RAG qui sont stockées dans le moteur RAG Vertex AI, de sorte que vos données sont physiquement isolées.
Si vous choisissez le niveau de base RagManagedDB ou le niveau évolutif, le moteur RAG Vertex AI provisionne une instance Spanner Enterprise Edition dans le projet correspondant :
Niveau de base : 100 unités de traitement avec sauvegarde
Niveau avec scaling : à partir d'un nœud (1 000 unités de traitement) et autoscaling jusqu'à 10 nœuds avec sauvegarde
Si un corpus RAG de votre projet choisit d'utiliser une base de données gérée par RAG pour la recherche vectorielle, l'instance Spanner gérée par RAG vous sera facturée.
Le moteur RAG Vertex AI affiche les coûts Spanner du projet géré par RAG correspondant dans votre projet Google Cloud . Vous pouvez ainsi consulter et payer les coûts des instances Spanner.
Pour en savoir plus sur les tarifs de Spanner, consultez la page Tarifs de Spanner.
Les outils de classement suivants sont acceptés après la récupération :
Reranker LLM : le moteur RAG Vertex AI utilise le modèle LLM que vous avez spécifié pour réorganiser les résultats de récupération. Les coûts du modèle LLM seront visibles et facturés directement dans votre projet.
API Vertex AI Search Ranking : le moteur RAG Vertex AI utilise l'API Vertex AI Search Ranking pour reclasser les résultats de récupération. Vous verrez et paierez l'API Ranking directement depuis votre projet.
Étapes suivantes
Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG de Vertex AI, consultez le démarrage rapide RAG pour Python.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]