Vertex AI RAG 引擎的帳單

本頁說明 Vertex AI RAG 引擎的價格和計費方式,具體取決於您使用的 Vertex AI RAG 引擎元件,例如模型、重新排序和向量儲存空間。

詳情請參閱「Vertex AI RAG Engine 總覽」頁面。

價格與計費

Vertex AI RAG 引擎可免費使用。不過,如果您設定 Vertex AI RAG Engine 元件,帳單可能會受到影響。

下表說明使用 RAG 元件時的計費方式。

元件 Vertex AI RAG 引擎的計費方式
資料擷取 Vertex AI RAG 引擎支援從不同資料來源擷取資料。例如上傳本機檔案、Cloud Storage 和 Google 雲端硬碟。從 Vertex AI RAG Engine 存取這些資料來源中的檔案是免費的,但這些資料來源可能會收取資料傳輸費用。例如資料輸出費用。
資料轉換 (剖析檔案)
  • 預設剖析器:免費。
  • LLM Parser:Vertex AI RAG Engine 會使用您指定的 LLM 模型剖析檔案,您將直接在專案中看到並支付 LLM 模型費用。
  • Document AI 版面配置剖析器:Vertex AI RAG 引擎會使用您指定的 Document AI 版面配置剖析器處理檔案,您將直接在專案中看到並支付 Document AI 版面配置剖析器的使用費用。
資料轉換 (檔案分塊) 支援固定大小的區塊,這項功能免費。
生成嵌入 Vertex AI RAG 引擎會使用您指定的嵌入模型,協調嵌入生成作業,而專案會產生與該模型相關的費用。

如需更多定價資訊,請參閱「在 Vertex AI 中建構及部署 AI 模型的費用」。

資料建立索引和擷取 RAG Engine 支援兩類向量資料庫,可進行向量搜尋:
  • RAG 管理的資料庫
  • 自備向量資料庫

RAG 管理的資料庫有兩個用途:
  • RAG 管理的資料庫會儲存 RAG 資源,例如 RAG 語料庫和 RAG 檔案。檔案內容會遭到排除。
  • 根據您的選擇,為向量搜尋建立嵌入索引並檢索。

RAG 管理的資料庫會使用 Spanner 執行個體做為後端。

針對每個專案,Vertex AI RAG 引擎都會佈建客戶專屬的 Google Cloud 專案,並管理儲存在 Vertex AI RAG 引擎中的 RAG 管理資源,確保資料在實體上受到隔離。

如果您選擇RagManagedDB Basic 層級或 Scaled 層級,Vertex AI RAG 引擎會在對應專案中佈建 Spanner Enterprise 版執行個體:

  • 基本層級:100 個處理單元 (含備份)
  • 擴充層級:從 1 個節點 (1,000 個處理單元) 開始,自動擴充至最多 10 個節點,並提供備份功能

如果專案中的任何 RAG 語料庫選擇使用 RAG 管理的資料庫進行向量搜尋,您就必須為 RAG 管理的 Spanner 執行個體付費。

Vertex AI RAG 引擎會將對應 RAG 管理專案的 Spanner 費用,顯示在您的 Google Cloud 專案中,方便您查看及支付 Spanner 執行個體費用。

如要進一步瞭解 Spanner 的定價詳細資料,請參閱 Spanner 定價

Vertex AI RAG 引擎的重新排序功能 擷取後,系統支援下列排名工具:
  • LLM 重新排序:Vertex AI RAG Engine 會使用您指定的大型語言模型,重新排序檢索結果,您將直接在專案中看到並支付大型語言模型費用。
  • Vertex AI Search 排序 API: Vertex AI RAG 引擎會使用 Vertex AI Search 排序 API 重新排序檢索結果,您將直接在專案中看到並支付排序 API 的費用。

刪除 Vertex AI RAG 引擎

下列程式碼範例說明如何透過 Google Cloud 控制台、Python 和 REST 刪除 Vertex AI RAG 引擎:

後續步驟