Vertex AI RAG 引擎的帳單

本頁面說明 Vertex AI RAG 引擎的價格和帳單,價格和帳單會根據您使用的 Vertex AI RAG 引擎元件 (例如模型、重新排序和向量儲存空間) 而定。

詳情請參閱 Vertex AI RAG 引擎總覽頁面。

價格與計費

Vertex AI RAG 引擎可免費使用。不過,如果您設定 Vertex AI RAG Engine 元件,帳單可能會受到影響。

下表說明使用 RAG 元件時的計費方式。

元件 Vertex AI RAG 引擎的計費方式
資料擷取 Vertex AI RAG 引擎支援從不同資料來源擷取資料。例如上傳本機檔案、Cloud Storage 和 Google 雲端硬碟中的檔案。從 Vertex AI RAG Engine 存取這些資料來源的檔案是免費的,但這些資料來源可能會收取資料傳輸費用。例如資料輸出費用。
資料轉換 (剖析檔案)
  • 預設剖析器:免費。
  • LLM Parser:Vertex AI RAG Engine 會使用您指定的 LLM 模型剖析檔案,您會直接在專案中看到並支付 LLM 模型費用。
  • Document AI 版面配置剖析器:Vertex AI RAG 引擎會使用您指定的 Document AI 版面配置剖析器處理檔案,您將直接在專案中看到並支付 Document AI 版面配置剖析器的使用費用。
資料轉換 (檔案分塊) 支援固定大小的區塊,這項功能免費。
生成嵌入 Vertex AI RAG 引擎會使用您指定的嵌入模型,協調嵌入生成作業,而專案會產生與該模型相關的費用。

如需更多定價資訊,請參閱「在 Vertex AI 中建構及部署 AI 模型的費用」。

資料建立索引和擷取 RAG Engine 支援兩類向量資料庫,可進行向量搜尋:
  • RAG 管理的資料庫
  • 自備向量資料庫

RAG 管理的資料庫有兩個用途:
  • RAG 管理的資料庫會儲存 RAG 資源,例如 RAG 語料庫和 RAG 檔案。檔案內容會遭到排除。
  • 根據您的選擇,進行向量搜尋的嵌入索引和擷取作業。

RAG 管理的資料庫會使用 Spanner 執行個體做為後端。

Vertex AI RAG 引擎會為每個專案佈建客戶專屬的 Google Cloud 專案,並管理儲存在 Vertex AI RAG 引擎中的 RAG 管理資源,確保資料在實體上受到隔離。

如果您選擇RagManagedDB Basic 層級 或 Scaled 層級,Vertex AI RAG 引擎會在對應專案中佈建 Spanner Enterprise 版執行個體:

  • 基本層級:100 個處理單元 (含備份)
  • 擴充層級:從 1 個節點 (1,000 個處理單元) 開始,自動擴充至最多 10 個節點,並提供備份功能

如果專案中的任何 RAG 語料庫選擇使用 RAG 管理的資料庫進行向量搜尋,您就必須為 RAG 管理的 Spanner 執行個體付費。

Vertex AI RAG 引擎會將對應 RAG 管理專案的 Spanner 費用,顯示在您的 Google Cloud 專案中,方便您查看及支付 Spanner 執行個體費用。

如要進一步瞭解 Spanner 的定價詳細資料,請參閱 Spanner 定價

Vertex AI RAG 引擎的重新排序功能 擷取後,系統支援下列排名工具:
  • LLM Reranker:Vertex AI RAG Engine 會使用您指定的 LLM 模型重新排序檢索結果,您將直接從專案查看及支付 LLM 模型費用。
  • Vertex AI Search 排序 API: Vertex AI RAG 引擎會使用 Vertex AI Search 排序 API 重新排序檢索結果,您將直接在專案中看到並支付排序 API 的費用。

後續步驟