調整參數
下列索引參數和資料庫標記會一併使用,以找出合適的召回率和 QPS 平衡點。
調整參數 | 說明 | 選項類型 |
---|---|---|
max_num_levels |
K-means 分群樹的質心層級數量上限。
|
建立索引 (選用) |
num_leaves |
要套用至這個索引的分區數量。建立索引時套用的分區數量會影響索引效能。增加一組向量的分區數量,即可建立更精細的索引,進而提升召回率和查詢效能。不過,這樣會導致索引建立時間變長。 由於三層樹狀結構的建構速度比兩層樹狀結構快,因此建立三層樹狀結構索引時,您可以增加 num_leaves_value 來提升效能。
|
建立索引 (必填) |
quantizer |
您想用於 K 平均值樹狀結構的量化器類型。預設值為 SQ8 ,可提供更優異的查詢效能,同時將喚回率損失降到最低 (通常低於 1-2%)。如需 99% 以上的喚回率,請設為 FLAT 。 |
建立索引 (選用) |
scann.enable_pca |
啟用主成分分析 (PCA),這是一種降維技術,可盡可能自動縮減嵌入的大小。這個選項預設為啟用。 如果發現召回率下降,請設為 false 。 |
建立索引 (選用) |
scann.pct_leaves_to_search (Preview) |
這個資料庫標記可讓您 [自動管理要搜尋的葉節點或分割區數量](/alloydb/omni/kubernetes/16.3.0/docs/ai/maintain-vector-indexes#manage-leave-to-search-split-partitions)。將這個值設為目前的分區數量。舉例來說,如要搜尋目前分區數量的 1%,請將這個值設為 1 。您可以將這個參數設為 0 到 100 之間的任何值。預設值為 0 ,這會停用這個參數,並使用 `scann.num_leaves_to_search` 計算要搜尋的葉節點數量。這個參數預設為停用。 |
查詢執行階段 (選用) |
scann.num_leaves_to_search |
這個資料庫標記可控制要搜尋的分葉或分割區絕對數量,讓您在召回率和 QPS 之間取捨。預設值為 num_leaves 中設定值的 1%。值越高,喚回度就越好,但 QPS 會降低。同樣地,如果值較低,喚回度就會較低,但 QPS 會較高。 |
查詢執行階段 (選用) |
scann.pre_reordering_num_neighbors |
設定資料庫標記後,系統會在初始搜尋找出候選項目後,於重新排序階段考慮指定數量的候選鄰點。將這個參數設為大於查詢要傳回的鄰居數。 值越高,喚回度就越好,但 QPS 會越低。將這個值設為 0 ,即可停用重新排序功能。如果建立索引時未啟用 PCA,則預設值為 0 。否則預設值為 50 x K ,其中 K 是查詢中指定的 LIMIT。 |
查詢執行階段 (選用) |
scann.num_search_threads |
多執行緒搜尋的搜尋者執行緒數量。在對延遲時間較為敏感的應用程式中,使用多個執行緒進行 ScaNN ANN 搜尋,有助於縮短單一查詢的延遲時間。如果資料庫已受 CPU 限制,這項設定不會改善單一查詢延遲。預設值為 2 。 |
查詢執行階段 (選用) |