建立 ScaNN 索引
詳情請參閱 ScaNN 索引參考資料。
兩層樹狀結構索引
如要套用建議,協助您找出資料集的最佳 num_leaves 和 num_leaves_to_search 值,請按照下列建議步驟操作:
- 如要建立針對下列情況最佳化的
ScaNN索引,請將num_leaves參數設為下列值,其中 rows 是索引資料表中的資料列數:- 兼顧索引建構時間和品質:將
num_leaves設為sqrt(rows)。 - 品質:將 num_leaves 設為 rows/100。
- 兼顧索引建構時間和品質:將
- 執行測試查詢,並提高
scann.num_of_leaves_to_search的值,直到達到目標召回率範圍 (例如 95%) 為止。如要進一步瞭解如何分析查詢,請參閱「分析查詢」。 - 請記下
scann.num_leaves_to_search和num_leaves之間的比例,後續步驟會用到。這個比率會提供資料集的近似值,協助您達成目標召回率。
如果您使用高維度向量 (500 個維度以上),且想提高召回率,請嘗試調整scann.pre_reordering_num_neighbors的值。預設值會設為500 * K值,其中K是您在查詢中設定的限制。 - 如果查詢達到目標召回率後,QPS 仍過低,請按照下列步驟操作:
- 重新建立索引,並根據下列指引增加
num_leaves和scann.num_leaves_to_search的值:- 將
num_leaves設為大於列數平方根的因數。舉例來說,如果索引的num_leaves設為資料列數的平方根,請嘗試將其設為平方根的兩倍。如果值已是兩倍,請嘗試將值設為平方根的三倍。 - 視需要增加
scann.num_leaves_to_search,以維持與num_leaves的比例 (您在步驟 3 中記下)。 - 將
num_leaves設為小於或等於資料列數除以 100 的值。
- 將
- 再次執行測試查詢。
執行測試查詢時,請嘗試降低
scann.num_leaves_to_search,找出可提高每秒查詢次數,同時維持高召回率的值。嘗試使用不同的scann.num_leaves_to_search值,不必重建索引。
- 重新建立索引,並根據下列指引增加
- 重複步驟 4,直到 QPS 和召回範圍都達到可接受的值。
三層樹狀結構索引
除了兩層樹狀結構 ScaNN 索引的建議外,請使用下列指引。
如要套用建議,找出 num_leaves 和 max_num_levels 索引參數的最佳值,請按照下列步驟操作:
根據成效目標,使用下列
num_leaves和max_num_levels組合建立ScaNN索引:- 平衡索引建構時間和品質:將
max_num_levels設為2,並將num_leaves設為power(rows, ⅔)。 - 最佳化品質:將
max_num_levels設為2,並將num_leaves設為rows/100。
- 平衡索引建構時間和品質:將
執行測試查詢。如要進一步瞭解如何分析查詢,請參閱「分析查詢」。
請記下
scann.num_leaves_to_search和num_leaves之間的比例,後續步驟會用到。這個比率會提供資料集的近似值,有助於您達成目標召回率。
如果您處理的是高維度向量 (500 個維度以上),且想提高召回率,請嘗試調整 scann.pre_reordering_num_neighbors 的值。預設值會設為 500 * K 值,其中 K 是您在查詢中設定的限制。
如果查詢達到目標召回率後,QPS 仍過低,請按照下列步驟操作:
- 重新建立索引,並根據下列指引增加
num_leaves和scann.num_leaves_to_search的值: - 將
num_leaves設為power(rows, ⅔)的較大因數。舉例來說,如果索引的num_leaves設為power(rows, ⅔),請嘗試將其設為power(rows, ⅔)的兩倍。如果值已加倍,請試著將power(rows, ⅔)設為三倍。 - 視需要增加
scann.num_leaves_to_search,以維持與num_leaves的比例 (您在步驟 3 中記下)。 - 將
num_leaves設為小於或等於rows/100的值。 - 再次執行測試查詢。執行測試查詢時,請嘗試降低
scann.num_leaves_to_search,找出可提高每秒查詢次數,同時維持高召回率的值。嘗試使用不同的scann.num_leaves_to_search值,不必重建索引。
- 重新建立索引,並根據下列指引增加
重複步驟 4,直到 QPS 和召回範圍都達到可接受的值。
索引維護作業
如果表格經常更新或插入資料,建議您定期重新為現有 ScaNN 索引建立索引,以提高召回準確度。
您可以監控索引指標,查看索引建構後向量分布或向量突變的變化,然後據此重新建立索引。如要進一步瞭解指標,請參閱「向量索引指標」。