Parametri di configurazione dell'indice

Per configurare gli indici per le ricerche di somiglianze, devi configurare il campi seguenti.

Per istruzioni su come configurare un indice, consulta Configurare i parametri indice.

Campi
contentsDeltaUri

string

Consente di inserire, aggiornare o eliminare i contenuti dei Ricerca vettoriale Index. La stringa deve essere un numero Percorso della directory di Cloud Storage, gs://BUCKET_NAME/PATH_TO_INDEX_DIR/.

Se imposti questo campo durante la chiamata IndexService.UpdateIndex, poi nessun altro Il campo Index può essere aggiornato anche nell'ambito della stessa chiamata. Impara come strutturare singoli file di dati.

isCompleteOverwrite

boolean

Se questo campo è impostato insieme a contentsDeltaUri durante la chiamata IndexService.UpdateIndex, i contenuti esistenti di Index verrà sostituito dai dati di contentsDeltaUri. Se questo campo è impostato su true, viene sovrascritto completamente con il nuovo file di metadati che fornisci.

config

NearestNeighborSearchConfig

La configurazione di Vector Search Index.

NearestNeighborSearchConfig

Campi
dimensions

int32

Obbligatorio. Il numero di dimensioni dei vettori di input. Usato per contenuti densi incorporamenti.

approximateNeighborsCount

int32

Obbligatorio se viene utilizzato l'algoritmo Tree-AH.

Il numero predefinito di vicini da trovare tramite una ricerca approssimativa prima il riordinamento esatto. Il riordinamento esatto è una procedura in cui i risultati restituiti da un algoritmo di ricerca approssimativo vengono riordinati utilizzando di calcolo delle distanze più costoso.

ShardSize ShardSize

Le dimensioni di ogni shard. Quando un indice è grande, viene eseguito lo sharding in base la dimensione dello shard specificata. Durante la pubblicazione, ogni shard viene pubblicato su una e scalare in modo indipendente.

distanceMeasureType

DistanceMeasureType

La misurazione della distanza utilizzata nella ricerca del vicino più prossimo.

featureNormType

FeatureNormType

Tipo di normalizzazione da eseguire su ciascun vettore.

algorithmConfig oneOf:

La configurazione degli algoritmi utilizzati da Vector Search per una ricerca efficiente. Utilizzato solo per gli incorporamenti densi.

DistanceMeasureType

Enum
SQUARED_L2_DISTANCE Distanza euclidea (L2)
L1_DISTANCE Distanza di Manhattan (L1)
DOT_PRODUCT_DISTANCE Valore predefinito. Definito come un valore negativo del prodotto scalare.
COSINE_DISTANCE Distanza coseno. Ti consigliamo vivamente di utilizzare DOT_PRODUCT_DISTANCE + UNIT_L2_NORM anziché la distanza COSINE. I nostri algoritmi sono stati ottimizzati maggiormente per la distanza DOT_PRODUCT e, se combinati con UNIT_L2_NORM, offrono lo stesso ranking e la stessa equivalenza matematica della distanza COSINE.

ShardSize

Enum
SHARD_SIZE_SMALL 2 GiB per shard
SHADE_SIZE_MEDIUM 20 GiB per shard
SHADE_SIZE_LARGE 50 GiB per shard

FeatureNormType

Enum
UNIT_L2_NORM Tipo di normalizzazione dell'unità L2.
NONE Valore predefinito. Nessun tipo di normalizzazione specificato.

TreeAhConfig

Questi sono i campi da selezionare per l'algoritmo Tree-AH.

Campi
fractionLeafNodesToSearch double
La frazione predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compresa tra 0,0 e 1,0, esclusi. In caso contrario, il valore predefinito è 0,05. per iniziare.
leafNodeEmbeddingCount int32
Numero di incorporamenti su ciascun nodo foglia. In caso contrario, il valore predefinito è 1000. per iniziare.
leafNodesToSearchPercent int32
Deprecato, utilizza fractionLeafNodesToSearch.

La percentuale predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compreso tra 1 e 100 inclusi. Il valore predefinito è 10 (ovvero 10%) se non impostato.

BruteForceConfig

Questa opzione implementa la ricerca lineare standard nel database per ogni query. Non esistono campi da configurare per una ricerca di forza bruta. Per selezionare questo algoritmo, passa un oggetto vuoto per BruteForceConfig a algorithmConfig.