本頁面介紹 Vertex AI RAG 引擎支援的向量資料庫。 您也可以瞭解如何將向量資料庫 (向量存放區) 連線至 RAG 語料庫。
向量資料庫在啟用 RAG 應用程式的擷取功能方面,扮演著至關重要的角色。 向量資料庫提供專門的向量嵌入儲存和查詢方式,向量嵌入是文字或其他資料的數學表示法,可擷取語意和關係。向量嵌入可讓 RAG 系統在龐大的知識庫中,快速準確地找出最相關的資訊,即使是複雜或細微的查詢也難不倒它。向量資料庫與嵌入模型搭配使用時,有助於克服 LLM 的限制,並提供更準確、相關且全面的回覆。
支援的向量資料庫
建立 RAG 語料庫時,Vertex AI RAG 引擎會預設提供企業級 RagManagedDb
做為向量資料庫,不需要額外佈建或管理。RagManagedDb
提供 KNN 和 ANN 搜尋選項,並允許切換至基本層級,進行快速原型設計和實驗。如要進一步瞭解如何在 RagManagedDb
上選擇擷取策略,或更新層級,請參閱「搭配 RAG 使用 RagManagedDb
」。如要讓 Vertex AI RAG 引擎自動建立及管理向量資料庫,請參閱建立 RAG 語料庫。
除了預設的 RagManagedDb
,Vertex AI RAG 引擎還可讓您在 RAG 語料庫中佈建及使用向量資料庫。在本例中,您必須負責向量資料庫的生命週期和可擴充性。
比較向量資料庫選項
下表列出 Vertex AI RAG 引擎支援的向量資料庫選項,並提供相關頁面的連結,說明如何在 RAG 語料庫中使用向量資料庫。
向量資料庫 | 優點 | 最適合用於 | 缺點 | 支援的距離指標 | 搜尋類型 | 推出階段 |
---|---|---|---|---|---|---|
RagManagedDb (預設) 是區域分散式可擴充資料庫服務,提供極高一致性和高可用性,可用於向量搜尋。
easy simple fast quick |
|
|
|
cosine |
KNN (預設) 和 ANN | 預覽 |
向量搜尋是 Vertex AI 中的向量資料庫服務,專為機器學習工作最佳化。 |
|
|
|
cosine dot-product |
ANN | 通用版 |
Vertex AI 特徵儲存庫是代管服務,可整理、儲存及提供機器學習特徵。 |
|
|
|
cosine dot-product L2 squared |
ANN | 預覽 |
Weaviate 是彈性且模組化的開放原始碼向量資料庫。 |
|
|
|
cosine dot-product L2 squared hamming manhattan |
支援 ANN + 混合搜尋 | 預覽 |
Pinecone 是全代管的雲端原生向量資料庫,專為高效能相似度搜尋而設計。 |
|
|
|
cosine euclidean dot-product |
ANN | 通用版 |
後續步驟
- 如要建立 RAG 語料庫,請參閱建立 RAG 語料庫範例。
- 如要列出所有 RAG 語料庫,請參閱列出 RAG 語料庫範例。