如要設定相似搜尋的索引,您必須設定下列欄位。
如需設定索引的操作說明,請參閱「設定索引參數」。
NearestNeighborSearch
| 欄位 | |
|---|---|
| contentsDeltaUri | 
 
      允許插入、更新或刪除 Vector Search  如果您在呼叫  | 
| isCompleteOverwrite | 
 如果在呼叫  | 
| config | Vector Search  | 
NearestNeighborSearchConfig
| 欄位 | |
|---|---|
| dimensions | 
 這是必要旗標,輸入向量的維度數量。僅用於稠密嵌入。 | 
| approximateNeighborsCount | 
 如果使用樹狀 AH 演算法,則為必要屬性。 執行確切重新排序之前,要透過近似搜尋尋找的預設鄰點數量。精確重新排序是一種程序,其中會使用較耗時的距離計算,重新排序近似搜尋演算法傳回的結果。 | 
| ShardSize | ShardSize每個分割區的大小。索引資料量大時,系統會根據指定的分割大小進行分割。在服務期間,每個區塊都會在個別節點上提供服務,並獨立調整。 | 
| distanceMeasureType | 最鄰近搜尋所使用的距離度量。 | 
| featureNormType | 要針對各個向量執行的正規化類型。 | 
| algorithmConfig | oneOf:Vector Search 用於高效率搜尋的演算法設定。僅用於稠密嵌入。 
 | 
DistanceMeasureType
| 列舉 | |
|---|---|
| SQUARED_L2_DISTANCE | 歐幾里得 (L2) 距離 | 
| L1_DISTANCE | 曼哈頓 (L1) 距離 | 
| DOT_PRODUCT_DISTANCE | 預設值。定義為點積的負值。 | 
| COSINE_DISTANCE | 餘弦距離。強烈建議您使用 DOT_PRODUCT_DISTANCE + UNIT_L2_NORM,而不要使用 COSINE 距離。我們的演算法已針對 DOT_PRODUCT 距離進行最佳化,如將點積距離與 UNIT_L2_NORM 搭配使用,在數學上就等同於餘弦距離,並能產生相同的排名。 | 
ShardSize
| 列舉 | |
|---|---|
| SHARD_SIZE_SMALL | 每個分割區 2 GiB | 
| SHARD_SIZE_MEDIUM | 每個分割區 20 GiB | 
| SHARD_SIZE_LARGE | 每個分割區 50 GiB | 
FeatureNormType
| 列舉 | |
|---|---|
| UNIT_L2_NORM | 單位 L2 正規化類型。 | 
| NONE | 預設值。未指定規格化類型。 | 
TreeAhConfig
這些是 tree-AH 演算法要選取的欄位。
| 欄位 | |
|---|---|
| fractionLeafNodesToSearch | double | 
| 分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 0.0 到 1.0 之間 (不含頭尾值)。如未設定,則預設值為 0.05。 | |
| leafNodeEmbeddingCount | int32 | 
| 每個分葉節點的嵌入項目數量。如未設定,則預設值為 1000。 | |
| leafNodesToSearchPercent | int32 | 
| 已淘汰,請改用 fractionLeafNodesToSearch。分葉節點的預設比率,任何查詢都有可能因此而經搜尋。必須介於 1 到 100 之間 (含 1 和 100)。如未設定,則預設值為 10 (代表 10%)。 | |
BruteForceConfig
這個選項會針對每項查詢,在資料庫中實作標準線性搜尋。沒有可設定的欄位可用於暴力搜尋。如要選取此演算法,請將 BruteForceConfig 的空物件傳遞至 algorithmConfig。