本頁面說明如何使用
Kubernetes 部署選項,部署 AlloyDB Omni
16.8.0 版。
選擇其他部署選項。
ScaNN 向量查詢效能總覽
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
選取說明文件版本:
本頁面提供概念總覽,說明如何使用 ScaNN 索引提升向量查詢效能。
ScaNN 索引會使用以樹狀結構量化為基礎的索引。在樹狀結構量化技術中,索引會與量化 (或雜湊) 函式一起學習搜尋樹狀結構。執行查詢時,搜尋樹會用於剪除搜尋空間,而量化則用於壓縮索引大小。這項修剪作業可加快查詢向量與資料庫向量之間相似度 (即距離) 的評分速度。
如要透過最鄰近查詢達到高每秒查詢次數 (QPS) 和高召回率,您必須以最適合資料和查詢的方式,分割 ScaNN
索引的樹狀結構。
當代高維度嵌入模型的一項常見特徵是,即使維度大幅降低,仍可保留大部分資訊,例如僅使用 20% 的嵌入維度,即可保留 90% 的資訊。為加快這類資料集的處理速度,AlloyDB ScaNN 會自動對已建立索引的向量執行主成分分析 (請參閱 scann.enable_pca below
),進一步減少向量搜尋的 CPU 和記憶體用量。由於降維仍會導致索引中的召回率略有損失,因此 AlloyDB ScaNN 會先從索引中選取大量 PCA 向量候選項目,然後以原始向量重新排序,藉此補償損失 (請參閱 scann.pre_reordering_num_neighbors
)。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-09-03 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-09-03 (世界標準時間)。"],[],[],null,[]]