Per configurare gli indici per le ricerche di somiglianze, devi configurare il campi seguenti.
Per istruzioni su come configurare un indice, consulta Configurare i parametri indice.
NearestNeighborSearch
Campi | |
---|---|
contentsDeltaUri |
Consente di inserire, aggiornare o eliminare i contenuti dei
Ricerca vettoriale Se imposti questo campo quando chiami
|
isCompleteOverwrite |
Se questo campo viene impostato insieme a
|
config |
La configurazione di Vector Search
|
NearestNeighborSearchConfig
Campi | |
---|---|
dimensions |
Obbligatorio. Il numero di dimensioni dei vettori di input. Utilizzato solo per gli embedding densi. |
approximateNeighborsCount |
Obbligatorio se viene utilizzato l'algoritmo tree-AH. Il numero predefinito di vicini da trovare tramite una ricerca approssimativa prima che viene eseguito il riordinamento esatto. Il riordinamento esatto è una procedura in cui i risultati restituiti da un algoritmo di ricerca approssimativo vengono riordinati utilizzando di calcolo delle distanze più costoso. |
ShardSize |
ShardSize
Le dimensioni di ogni shard. Quando un indice è di grandi dimensioni, viene suddiviso in base alle dimensioni dello shard specificate. Durante la pubblicazione, ogni shard viene pubblicato su una e scalare in modo indipendente. |
distanceMeasureType |
La misurazione della distanza utilizzata nella ricerca del vicino più prossimo. |
featureNormType |
Tipo di normalizzazione da eseguire su ciascun vettore. |
algorithmConfig |
oneOf:
La configurazione degli algoritmi utilizzati da Vector Search per una ricerca efficiente. Utilizzato solo per gli incorporamenti densi.
|
DistanceMeasureType
Enum | |
---|---|
SQUARED_L2_DISTANCE |
Distanza euclidea (L2) |
L1_DISTANCE |
Distanza di Manhattan (L1) |
DOT_PRODUCT_DISTANCE |
Valore predefinito. Definito come un valore negativo del prodotto scalare. |
COSINE_DISTANCE |
Distanza coseno. Ti consigliamo vivamente di utilizzare DOT_PRODUCT_DISTANCE + UNIT_L2_NORM anziché la distanza COSINE. I nostri algoritmi sono stati ottimizzati maggiormente per la distanza DOT_PRODUCT e, se combinati con UNIT_L2_NORM, offrono lo stesso ranking e la stessa equivalenza matematica della distanza COSINE. |
ShardSize
Enum | |
---|---|
SHARD_SIZE_SMALL |
2 GiB per shard |
SHARD_SIZE_MEDIUM |
20 GiB per shard |
SHARD_SIZE_LARGE |
50 GiB per shard |
FeatureNormType
Enum | |
---|---|
UNIT_L2_NORM |
Tipo di normalizzazione L2 dell'unità. |
NONE |
Valore predefinito. Nessun tipo di normalizzazione specificato. |
TreeAhConfig
Questi sono i campi da selezionare per l'algoritmo Tree-AH.
Campi | |
---|---|
fractionLeafNodesToSearch |
double |
La frazione predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compresa tra 0,0 e 1,0, esclusi. Se non è impostato, il valore predefinito è 0,05. | |
leafNodeEmbeddingCount |
int32 |
Numero di incorporamenti su ciascun nodo foglia. In caso contrario, il valore predefinito è 1000. per iniziare. | |
leafNodesToSearchPercent |
int32 |
Funzionalità deprecata, utilizza fractionLeafNodesToSearch .La percentuale predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compreso tra 1 e 100, inclusi. Se non è impostato, il valore predefinito è 10 (ovvero il 10%). |
BruteForceConfig
Questa opzione implementa la ricerca lineare standard nel database per
ogni query. Non esistono campi da configurare per una ricerca di forza bruta.
Per selezionare questo algoritmo, passa un oggetto vuoto per BruteForceConfig
a algorithmConfig
.