Cette page décrit la tarification et la facturation du moteur RAG Vertex AI en fonction des composants que vous utilisez, tels que les modèles, le reranking et le stockage vectoriel.
Pour en savoir plus, consultez la page Présentation du moteur RAG de Vertex AI.
Tarification et facturation
Le moteur RAG de Vertex AI est gratuit. Toutefois, si vous configurez des composants du moteur RAG Vertex AI, la facturation peut être affectée.
Ce tableau explique comment la facturation fonctionne lorsque vous utilisez les composants RAG.
Composant | Fonctionnement de la facturation avec le moteur RAG Vertex AI |
---|---|
Ingestion de données | Le moteur RAG Vertex AI permet d'ingérer des données provenant de différentes sources de données. Par exemple, l'importation de fichiers locaux, Cloud Storage et Google Drive. L'accès aux fichiers de ces sources de données à partir du moteur RAG Vertex AI est gratuit, mais ces sources de données peuvent facturer le transfert de données. Par exemple, les coûts de sortie des données. |
Transformation des données (analyse des fichiers) |
|
Transformation des données (segmentation des fichiers) | Il est compatible avec le découpage en blocs de taille fixe, qui est gratuit. |
Génération d'embeddings | Le moteur RAG Vertex AI orchestre la génération d'embeddings à l'aide du modèle d'embedding que vous avez spécifié. Les coûts associés à ce modèle sont facturés à votre projet. Pour en savoir plus sur les tarifs, consultez Coût de création et de déploiement de modèles d'IA dans Vertex AI. |
Indexation et récupération des données |
Le moteur RAG est compatible avec deux catégories de bases de données vectorielles pour la recherche vectorielle :
Une base de données gérée par RAG a deux objectifs :
Une base de données gérée par RAG utilise une instance Spanner comme backend. Pour chacun de vos projets, le moteur RAG Vertex AI provisionne un projet Google Cloud spécifique au client et gère les ressources gérées par RAG qui sont stockées dans le moteur RAG Vertex AI, de sorte que vos données sont physiquement isolées. Si vous choisissez le niveau de base
Si un corpus RAG de votre projet choisit d'utiliser une base de données gérée par RAG pour la recherche vectorielle, l'instance Spanner gérée par RAG vous sera facturée. Le moteur RAG Vertex AI affiche les coûts Spanner du projet géré par RAG correspondant dans votre projet Google Cloud . Vous pouvez ainsi consulter et payer les coûts des instances Spanner. Pour en savoir plus sur les tarifs de Spanner, consultez la page Tarifs de Spanner. |
Reranking pour le moteur RAG Vertex AI | Les outils de classement suivants sont acceptés après la récupération :
|
Étapes suivantes
- Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG de Vertex AI, consultez le démarrage rapide RAG pour Python.
- Pour en savoir plus sur l'ancrage, consultez la présentation de l'ancrage.
- Pour en savoir plus sur les réponses du moteur RAG, consultez Résultats de récupération et de génération du moteur RAG de Vertex AI.
- Pour en savoir plus sur l'architecture RAG :