瞭解 RagManagedDb

本頁面將介紹 RagManagedDb、其基礎技術,以及 RagManagedDb 在 Vertex AI RAG 引擎中的用途。此外,這個頁面也會說明可調整效能的不同層級 (可能會影響費用),並提供刪除 Vertex AI RAG Engine 資料的說明,以停止計費。

總覽

Vertex AI RAG 引擎使用 RagManagedDb,這是企業適用的全代管 Google Spanner 執行個體,Vertex AI RAG 引擎會用來儲存資源,您也可以選擇將其做為 RAG 語料庫的向量資料庫

Vertex AI RAG 引擎透過 Spanner 提供一致、高可用性且高度可擴充的資料庫,支援您的應用程式。如要進一步瞭解 Google Spanner,請參閱 Spanner

無論您選擇哪種向量資料庫,Vertex AI RAG 引擎都會將 RAG 語料庫和 RAG 檔案資源中繼資料儲存在 RagManagedDb。向量資料庫僅用於儲存及擷取嵌入。除了儲存資源,RagManagedDb 也可用於儲存及管理文件的向量表示法。接著,系統會根據文件與指定查詢的語意相似度,從向量資料庫擷取相關文件。

管理等級

Vertex AI RAG 引擎提供兩種級別,可讓您根據使用情形和效能需求擴充 RagManagedDb 執行個體,並可選擇使用第三種級別刪除 Vertex AI RAG 引擎資料。

層級是專案層級的設定,可在 RagEngineConfig 資源中使用,會影響使用 RagManagedDb 的 RAG 語料庫。RagEngineConfig提供下列層級:

  • 「資源調度」級別:這個級別提供正式環境規模的效能,以及自動調度資源功能。適合擁有大量資料或對效能需求較高的工作負載的客戶。在內部,這個層級會將 Spanner 執行個體設為自動調度資源設定,節點數量下限為 1 個 (1,000 個處理單元),上限為 10 個 (10,000 個處理單元)。

  • 基本級別 (預設):這個級別的成本效益高,運算資源需求低,可能適合下列情況:

    • 使用下列參數進行實驗:RagManagedDb
    • 資料量少。
    • 容許延遲的工作負載。
    • 僅搭配其他向量資料庫使用 Vertex AI RAG 引擎。

    為提供基本級,RagManagedDb 會將基礎 Spanner 執行個體設為 100 個處理單位的固定設定,相當於 0.1 個節點。

  • 未佈建層級:這個層級會刪除 RagManagedDb 和其基礎 Spanner 執行個體。「未佈建」層級會停用 Vertex AI RAG 引擎服務,並刪除這項服務中保存的資料,無論您使用哪個向量資料庫RagCorpora。這樣服務就會停止計費。如要進一步瞭解帳單,請參閱「Vertex AI RAG 引擎帳單」。

    資料刪除後即無法復原。如要再次使用 Vertex AI RAG 引擎,請呼叫 UpdateRagEngineConfig API 更新層級。

取得專案設定

下列程式碼範例說明如何針對各類層級使用 GetRagEngineConfig API:

更新專案設定

下列程式碼範例說明如何針對各個層級使用 UpdateRagEngineConfig API:

後續步驟