Vertex AI RAG 引擎结算

本页面介绍了 Vertex AI RAG 引擎的定价和结算方式,具体取决于您使用的 Vertex AI RAG 引擎组件,例如模型、重新排名和向量存储。

如需了解详情,请参阅 Vertex AI RAG 引擎概览页面。

价格和结算

Vertex AI RAG 引擎可免费使用。不过,如果您配置 Vertex AI RAG 引擎组件,则结算可能会受到影响。

下表说明了使用 RAG 组件时的结算方式。

组件 Vertex AI RAG Engine 的结算方式
数据注入 Vertex AI RAG 引擎支持从不同的数据源提取数据。例如,上传本地文件、Cloud Storage 和 Google 云端硬盘中的文件。从 Vertex AI RAG 引擎访问这些数据源中的文件是免费的,但这些数据源可能会收取数据传输费用。例如,数据出站费用。
数据转换(文件解析)
  • 默认解析器:免费。
  • LLM 解析器:Vertex AI RAG 引擎使用您指定的 LLM 模型来解析文件,您将直接从项目中查看并支付 LLM 模型费用。
  • Document AI 布局解析器:Vertex AI RAG 引擎会使用您指定的 Document AI 布局解析器来处理文件,您将直接在项目中看到并支付 Document AI 布局解析器的使用费用。
数据转换(文件分块) 支持免费的固定大小分块。
生成嵌入 Vertex AI RAG 引擎会使用您指定的嵌入模型来编排嵌入生成,并且您的项目会产生与该模型相关的费用。

如需了解更多价格信息,请参阅 Vertex AI 中构建和部署 AI 模型的费用

数据索引和检索 RAG 引擎支持以下两类向量数据库,用于向量搜索:
  • RAG 管理的数据库
  • 自带向量数据库

RAG 管理的数据库有以下两个用途:
  • RAG 管理的数据库 用于存储 RAG 资源,例如 RAG 语料库和 RAG 文件。文件内容被排除。
  • 根据您的选择,为向量搜索提供嵌入索引和检索功能。

RAG 管理的数据库使用 Spanner 实例作为后端。

对于您的每个项目,Vertex AI RAG 引擎都会预配一个客户专用的 Google Cloud 项目,并管理存储在 Vertex AI RAG 引擎中的 RAG 管理资源,以便您的数据实现物理隔离。

如果您选择 RagManagedDB Basic 层级或 Scaled 层级,Vertex AI RAG 引擎会在相应项目中预配 Spanner Enterprise 版实例:

  • 基本层级:100 个处理单元,支持备份
  • 扩缩层级:从 1 个节点(1,000 个处理单元)开始,自动扩缩至最多 10 个节点,并提供备份

如果项目中的任何 RAG 语料库选择使用 RAG 管理的数据库进行向量搜索,您将需要为 RAG 管理的 Spanner 实例付费。

Vertex AI RAG 引擎会将相应 RAG 管理项目的 Spanner 费用显示在您的 Google Cloud 项目中,以便您查看和支付 Spanner 实例费用。

如需详细了解 Spanner 的价格,请参阅 Spanner 价格

Vertex AI RAG Engine 的重新排名 以下排名工具在检索后受支持:
  • LLM Reranker:Vertex AI RAG 引擎使用您指定的 LLM 模型对检索结果进行重新排名,您将直接从项目中查看并支付 LLM 模型费用。
  • Vertex AI Search 排名 API: Vertex AI RAG Engine 使用 Vertex AI Search 排名 API 对检索结果进行重新排名,您将直接从项目中看到并支付排名 API 的费用。

后续步骤