本頁面將介紹 RagManagedDb
、其基礎技術,以及 RagManagedDb
在 Vertex AI RAG 引擎中的用途。此外,這個頁面也會說明可調整效能的不同層級 (可能會影響費用),並提供刪除 Vertex AI RAG Engine 資料的相關操作說明,刪除後系統就會停止計費。
總覽
Vertex AI RAG 引擎使用 RagManagedDb
,這是企業適用的全代管 Google Spanner 執行個體,Vertex AI RAG 引擎會用來儲存資源,您也可以選擇將其做為 RAG 語料庫的向量資料庫。
Vertex AI RAG Engine 透過 Spanner 提供一致、高可用性且高度可擴充的資料庫,支援您的應用程式。如要進一步瞭解 Google Spanner,請參閱 Spanner。
無論您選擇哪種向量資料庫,Vertex AI RAG 引擎都會將 RAG 語料庫和 RAG 檔案資源中繼資料儲存在 RagManagedDb
。向量資料庫僅用於儲存及擷取嵌入。除了儲存資源,RagManagedDb
也可用於儲存及管理文件的向量表示法。然後根據文件與指定查詢的語意相似度,使用向量資料庫擷取相關文件。
管理等級
Vertex AI RAG 引擎提供三種層級,可讓您根據用量和效能需求,選擇其中兩種層級來擴充 RagManagedDb
執行個體,並視需要透過第三種層級刪除 Vertex AI RAG 引擎資料。
層級是專案層級的設定,可在 RagEngineConfig
資源中使用,會影響使用 RagManagedDb
的 RAG 語料庫。RagEngineConfig
提供下列層級:
擴充層級:這個層級提供生產規模的效能,以及自動擴充功能。適合資料量龐大或對效能要求嚴苛的工作負載。在內部,這個層級會將 Spanner 執行個體設為自動調度資源設定,節點數量下限為 1 個 (1,000 個處理單元),上限為 10 個 (10,000 個處理單元)。
基本級 (預設):這個層級的費用較低,運算量也較少,可能適合下列情況:
- 使用下列參數進行實驗:
RagManagedDb
。 - 資料量較少。
- 對延遲不敏感的工作負載。
- 僅搭配其他向量資料庫使用 Vertex AI RAG 引擎。
為提供基本級,
RagManagedDb
會將基礎 Spanner 執行個體設為 100 個處理單位的固定設定,相當於 0.1 個節點。- 使用下列參數進行實驗:
未佈建層級:這個層級會刪除
RagManagedDb
和其基礎 Spanner 執行個體。「未佈建」層級會停用 Vertex AI RAG 引擎服務,並刪除這項服務中保存的資料,無論您使用哪個向量資料庫RagCorpora
。這樣服務就會停止計費。如要進一步瞭解帳單,請參閱「Vertex AI RAG 引擎帳單」。資料刪除後即無法復原。如要再次使用 Vertex AI RAG 引擎,請呼叫
UpdateRagEngineConfig
API 更新層級。
取得專案設定
下列程式碼範例說明如何針對各類層級使用 GetRagEngineConfig
API:
第 1 版 (v1) API 程式碼範例。
v1beta1 API 程式碼範例。
更新專案設定
下列程式碼範例說明如何針對各類層級使用 UpdateRagEngineConfig
API:
第 1 版 (v1) API 程式碼範例。
v1beta1 API 程式碼範例。
後續步驟
- 如要瞭解如何使用預設的 RAG API v1,請參閱「RAG API v1」。
- 如要瞭解如何使用 RAG API v1beta1,請參閱 RAG API v1beta1。
- 如要進一步瞭解
RagManagedDb
,以及如何管理層級設定和 RAG 語料庫層級的檢索策略,請參閱「搭配 Vertex AI RAG 引擎使用 RagManagedDb」。