Parametri di configurazione degli indici

Per configurare gli indici per le ricerche di somiglianza, devi configurare i campi seguenti. Per istruzioni su come configurare un indice, consulta Configurare i parametri degli indici.

`NearestNeighborSearch`

Campi

Campi
`contentsDeltaUri`	`string` Consente di inserire, aggiornare o eliminare i contenuti di Vector Search `Index`. La stringa deve essere un percorso della directory Cloud Storage valido, come `gs://BUCKET_NAME/PATH_TO_INDEX_DIR/`. Se imposti questo campo durante la chiamata a `IndexService.UpdateIndex`, nessun altro campo `Index` potrà essere aggiornato anche nell'ambito della stessa chiamata. Scopri come strutturare singoli file di dati.
`isCompleteOverwrite`	`boolean` Se questo campo viene impostato insieme a `contentsDeltaUri` durante la chiamata a `IndexService.UpdateIndex`, i contenuti esistenti di `Index` verranno sostituiti dai dati di `contentsDeltaUri`.
`config`	`NearestNeighborSearchConfig` La configurazione della ricerca vettoriale `Index`.

contentsDeltaUri

string

Consente di inserire, aggiornare o eliminare i contenuti di Vector Search Index. La stringa deve essere un percorso della directory Cloud Storage valido, come gs://BUCKET_NAME/PATH_TO_INDEX_DIR/.

Se imposti questo campo durante la chiamata a IndexService.UpdateIndex, nessun altro campo Index potrà essere aggiornato anche nell'ambito della stessa chiamata. Scopri come strutturare singoli file di dati.

isCompleteOverwrite

boolean

Se questo campo viene impostato insieme a contentsDeltaUri durante la chiamata a IndexService.UpdateIndex, i contenuti esistenti di Index verranno sostituiti dai dati di contentsDeltaUri.

config

NearestNeighborSearchConfig

La configurazione della ricerca vettoriale Index.

`NearestNeighborSearchConfig`

Campi
`dimensions`	`int32` Obbligatorio. Il numero di dimensioni dei vettori di input.
`approximateNeighborsCount`	`int32` Obbligatorio se viene utilizzato l'algoritmo tree-AH. Il numero predefinito di vicini da trovare tramite una ricerca approssimativa prima che venga eseguito il riordinamento esatto. Il riordinamento esatto è una procedura in cui i risultati restituiti da un algoritmo di ricerca approssimativa vengono riordinati utilizzando un calcolo della distanza più costoso.
`ShardSize`	`ShardSize` Le dimensioni di ogni shard. Quando un indice è di grandi dimensioni, viene segmentato in base alle dimensioni dello shard specificate. Durante la pubblicazione, ogni shard viene pubblicato su un nodo separato e scala in modo indipendente.
`distanceMeasureType`	`DistanceMeasureType` La misurazione della distanza utilizzata nella ricerca del vicino più prossimo.
`featureNormType`	`FeatureNormType` Tipo di normalizzazione da eseguire su ciascun vettore.
`algorithmConfig`	`oneOf:` `TreeAhConfig` `BruteForceConfig` La configurazione degli algoritmi che Vector Search utilizza per una ricerca efficiente. `TreeAhConfig`: opzioni di configurazione per l'utilizzo dell'algoritmo ad albero ad albero. Per saperne di più, consulta questo blog Scaling deep Retrieval with TensorFlow Recommenders and Vector Search `BruteForceConfig`: questa opzione implementa la ricerca lineare standard nel database per ogni query. Non ci sono campi da configurare per una ricerca di forza bruta. Per selezionare questo algoritmo, trasmetti un oggetto vuoto per `BruteForceConfig`.

`DistanceMeasureType`

Enum
`SQUARED_L2_DISTANCE`	Distanza euclidea (L₂)
`L1_DISTANCE`	Distanza di Manhattan (L₁)
`DOT_PRODUCT_DISTANCE`	Valore predefinito. Definito come un valore negativo del prodotto scalare.
`COSINE_DISTANCE`	Distanza coseno. Consigliamo vivamente di utilizzare DOT_PRODUCT_DISTANZA + UNIT_L2_NORM anziché la distanza COSINE. I nostri algoritmi sono stati ottimizzati maggiormente per la distanza DOT_PRODUCT e, se combinati con UNIT_L2_NORM, offrono lo stesso ranking e le stesse equivalenze matematica della distanza COSINE.

`ShardSize`

Enum
`SHARD_SIZE_SMALL`	2 GiB per shard
`SHADE_SIZE_MEDIUM`	20 GiB per shard
`SHADE_SIZE_LARGE`	50 GiB per shard

`FeatureNormType`

Enum
`UNIT_L2_NORM`	Tipo di normalizzazione dell'unità L2.
`NONE`	Valore predefinito. Nessun tipo di normalizzazione specificato.

`TreeAhConfig`

Questi sono i campi da selezionare per l'algoritmo tree-AH.

Campi
`fractionLeafNodesToSearch`	`double`
	La frazione predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compresa tra 0,0 e 1,0, esclusi. Se non è impostata, il valore predefinito è 0,05.
`leafNodeEmbeddingCount`	`int32`
	Numero di incorporamenti su ciascun nodo foglia. Se non è impostato, il valore predefinito è 1000.
`leafNodesToSearchPercent`	`int32`
	Deprecata, utilizza `fractionLeafNodesToSearch`. La percentuale predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compreso tra 1 e 100 inclusi. Il valore predefinito è 10 (significa 10%) se non impostato.

`BruteForceConfig`

Questa opzione implementa la ricerca lineare standard nel database per ogni query. Non ci sono campi da configurare per una ricerca di forza bruta. Per selezionare questo algoritmo, passa un oggetto vuoto per BruteForceConfig a algorithmConfig.