本頁說明 Vertex AI RAG 引擎的價格和計費方式,具體取決於您使用的 Vertex AI RAG 引擎元件,例如模型、重新排序和向量儲存空間。
詳情請參閱「Vertex AI RAG Engine 總覽」頁面。
價格與計費
Vertex AI RAG 引擎可免費使用。不過,如果您設定 Vertex AI RAG Engine 元件,帳單可能會受到影響。
下表說明使用 RAG 元件時的計費方式。
元件 | Vertex AI RAG 引擎的計費方式 |
---|---|
資料擷取 | Vertex AI RAG 引擎支援從不同資料來源擷取資料。例如上傳本機檔案、Cloud Storage 和 Google 雲端硬碟。從 Vertex AI RAG Engine 存取這些資料來源中的檔案是免費的,但這些資料來源可能會收取資料傳輸費用。例如資料輸出費用。 |
資料轉換 (剖析檔案) |
|
資料轉換 (檔案分塊) | 支援固定大小的區塊,這項功能免費。 |
生成嵌入 | Vertex AI RAG 引擎會使用您指定的嵌入模型,協調嵌入生成作業,而專案會產生與該模型相關的費用。 如需更多定價資訊,請參閱「在 Vertex AI 中建構及部署 AI 模型的費用」。 |
資料建立索引和擷取 |
RAG Engine 支援兩類向量資料庫,可進行向量搜尋:
RAG 管理的資料庫有兩個用途:
RAG 管理的資料庫會使用 Spanner 執行個體做為後端。 針對每個專案,Vertex AI RAG 引擎都會佈建客戶專屬的 Google Cloud 專案,並管理儲存在 Vertex AI RAG 引擎中的 RAG 管理資源,確保資料在實體上受到隔離。 如果您選擇
如果專案中的任何 RAG 語料庫選擇使用 RAG 管理的資料庫進行向量搜尋,您就必須為 RAG 管理的 Spanner 執行個體付費。 Vertex AI RAG 引擎會將對應 RAG 管理專案的 Spanner 費用,顯示在您的 Google Cloud 專案中,方便您查看及支付 Spanner 執行個體費用。 如要進一步瞭解 Spanner 的定價詳細資料,請參閱 Spanner 定價。 |
Vertex AI RAG 引擎的重新排序功能 | 擷取後,系統支援下列排名工具:
|
刪除 Vertex AI RAG 引擎
下列程式碼範例說明如何透過 Google Cloud 控制台、Python 和 REST 刪除 Vertex AI RAG 引擎:
後續步驟
- 如要瞭解如何使用 Vertex AI SDK 執行 Vertex AI RAG Engine 工作,請參閱 Python 適用的 RAG 快速入門導覽課程。
- 如要瞭解基準建立功能,請參閱基準建立功能總覽。
- 如要進一步瞭解 RAG 的回覆,請參閱「Vertex AI RAG 引擎的檢索和生成輸出內容」。
- 如要瞭解 RAG 架構: