本页面介绍了 Vertex AI RAG 引擎的定价和结算方式,具体取决于您使用的 Vertex AI RAG 引擎组件,例如模型、重新排名和向量存储。
如需了解详情,请参阅 Vertex AI RAG 引擎概览页面。
价格和结算
Vertex AI RAG 引擎可免费使用。不过,如果您配置 Vertex AI RAG 引擎组件,则结算可能会受到影响。
下表说明了使用 RAG 组件时的结算方式。
组件 | Vertex AI RAG Engine 的结算方式 |
---|---|
数据注入 | Vertex AI RAG 引擎支持从不同的数据源提取数据。例如,上传本地文件、Cloud Storage 和 Google 云端硬盘中的文件。从 Vertex AI RAG 引擎访问这些数据源中的文件是免费的,但这些数据源可能会收取数据传输费用。例如,数据出站费用。 |
数据转换(文件解析) |
|
数据转换(文件分块) | 支持免费的固定大小分块。 |
生成嵌入 | Vertex AI RAG 引擎会使用您指定的嵌入模型来编排嵌入生成,并且您的项目会产生与该模型相关的费用。 如需了解更多价格信息,请参阅 Vertex AI 中构建和部署 AI 模型的费用。 |
数据索引和检索 |
RAG 引擎支持以下两类向量数据库,用于向量搜索:
RAG 管理的数据库有以下两个用途:
RAG 管理的数据库使用 Spanner 实例作为后端。 对于您的每个项目,Vertex AI RAG 引擎都会预配一个客户专用的 Google Cloud 项目,并管理存储在 Vertex AI RAG 引擎中的 RAG 管理资源,以便您的数据实现物理隔离。 如果您选择
如果项目中的任何 RAG 语料库选择使用 RAG 管理的数据库进行向量搜索,您将需要为 RAG 管理的 Spanner 实例付费。 Vertex AI RAG 引擎会将相应 RAG 管理项目的 Spanner 费用显示在您的 Google Cloud 项目中,以便您查看和支付 Spanner 实例费用。 如需详细了解 Spanner 的价格,请参阅 Spanner 价格。 |
Vertex AI RAG Engine 的重新排名 | 以下排名工具在检索后受支持:
|
后续步骤
- 如需了解如何使用 Vertex AI SDK 运行 Vertex AI RAG 引擎任务,请参阅 RAG Python 版快速入门。
- 如需了解接地,请参阅接地概览。
- 如需详细了解 RAG 的回答,请参阅 Vertex AI RAG Engine 的检索和生成输出。
- 如需了解 RAG 架构,请参阅: