Una volta implementato un peering di rete VPC o un endpoint di indice Private Service Connect, l'esecuzione di query varia leggermente a seconda della modalità di implementazione:
- Automazione di Private Service Connect
- Configurazione manuale di Private Service Connect
- Peering di rete VPC
Deployment con l'automazione di Private Service Connect
Per IndexEndpoints
di cui è stato eseguito il deployment con l'automazione di Private Service Connect,
l'SDK Python mapperà automaticamente la rete Private Service Connect
all'endpoint appropriato. Se non utilizzi l'SDK Python, devi connetterti direttamente all'indirizzo IP creato per l'endpoint, seguendo le istruzioni per
interrogare un deployment manuale di Private Service Connect.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Deployment con configurazione manuale di Private Service Connect
Per Private Service Connect IndexEndpoints
di cui è stato eseguito il deployment con una connessione configurata manualmente,
si accede all'endpoint utilizzando l'indirizzo IP dell'indirizzo di calcolo inoltrato
al collegamento al servizio Private Service Connect dell'endpoint.
Se non è già noto, puoi ottenere l'URI dell'allegato del servizio a cui è stato inoltrato l'indirizzo IP utilizzando i comandi gcloud ai index-endpoints describe
e gcloud compute forwarding-rules list
.
Effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: ID endpoint indice completo.
- REGION: la regione in cui viene eseguito il deployment dell'endpoint dell'indice.
SERVICE_ATTACHMENT_URI=`gcloud ai index-endpoints describe INDEX_ENDPOINT_ID \ --region=REGION \ --format="value(deployedIndexes.privateEndpoints.serviceAttachment)"` gcloud compute forwarding-rules list --filter="TARGET:${SERVICE_ATTACHMENT_URI}"
L'output includerà l'indirizzo IP interno da utilizzare per eseguire query su
IndexEndpoint
.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Riga di comando
Per eseguire una query su un DeployedIndex
, connettiti al relativo TARGET_IP
sulla porta 10000
e chiama il metodo Match
o
BatchMatch
. Inoltre, puoi eseguire query utilizzando un ID incorporamento specifico.
Gli esempi seguenti utilizzano lo strumento open source grpc_cli
per inviare richieste gRPC
al server di indice di cui è stato eseguito il deployment.
Match
.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match 'deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.1,..]'
Nel secondo esempio, combini due query separate nella stessa richiesta BatchMatch
.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.BatchMatch 'requests: [{deployed_index_id: "${DEPLOYED_INDEX_ID}", requests: [{deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.1,..]}, {deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.2,..]}]}]'
Devi effettuare chiamate a queste API da un client in esecuzione nello stesso VPC con cui è stato eseguito il peering del servizio.
Per eseguire una query utilizzando un embedding_id
, utilizza l'esempio seguente.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match "deployed_index_id:'"test_index1"',embedding_id: '"606431"'"
In questo esempio, invii una query utilizzando token e limiti numerici.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match 'deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [1, 1], "sparse_embedding": {"values": [111.0,111.1,111.2], "dimensions": [10,20,30]}, numeric_restricts: [{name: "double-ns", value_double: 0.3, op: LESS_EQUAL}, {name: "double-ns", value_double: -1.2, op: GREATER}, {name: "double-ns", value_double: 0., op: NOT_EQUAL}], restricts: [{name: "color", allow_tokens: ["red"]}]'
Per saperne di più, vedi Descrizione delle librerie client.
Console
Segui queste istruzioni per eseguire query su un indice VPC dalla console.
- Nella sezione Vertex AI della console Google Cloud , vai alla sezione Deployment e utilizzo. Seleziona Vector Search.
- Seleziona l'indice VPC su cui vuoi eseguire una query. Viene visualizzata la pagina Informazioni indice.
- Scorri verso il basso fino alla sezione Indici implementati e seleziona l'indice implementato per cui vuoi eseguire la query. Viene visualizzata la pagina Informazioni sull'indice di cui è stato eseguito il deployment.
- Nella sezione Indice query, seleziona i parametri della query. Puoi scegliere di eseguire query in base a un vettore o a un punto dati specifico.
- Esegui la query utilizzando lo strumento open source grpc_cli o l'SDK Vertex AI per Python.
Deployment con il peering di rete VPC
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Nota:l'SDK Python cerca automaticamente l'indirizzo IP di un
IndexEndpoint
di cui è stato eseguito il deployment con il peering di rete VPC.
Riga di comando
Ogni DeployedIndex
ha un TARGET_IP
, che puoi recuperare nell'elenco di IndexEndpoints
.
Per eseguire una query su un DeployedIndex
, connettiti al relativo TARGET_IP
sulla porta 10000
e chiama il metodo Match
o
BatchMatch
. Inoltre, puoi eseguire query utilizzando un ID incorporamento specifico.
Gli esempi seguenti utilizzano lo strumento open source grpc_cli
per inviare richieste gRPC
al server di indice di cui è stato eseguito il deployment.
Match
.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match 'deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.1,..]'
Nel secondo esempio, combini due query separate nella stessa richiesta BatchMatch
.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.BatchMatch 'requests: [{deployed_index_id: "${DEPLOYED_INDEX_ID}", requests: [{deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.1,..]}, {deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [-0.2,..]}]}]'
Devi effettuare chiamate a queste API da un client in esecuzione nello stesso VPC con cui è stato eseguito il peering del servizio.
Per eseguire una query utilizzando un embedding_id
, utilizza l'esempio seguente.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match "deployed_index_id:'"test_index1"',embedding_id: '"606431"'"
In questo esempio, invii una query utilizzando token e limiti numerici.
./grpc_cli call ${TARGET_IP}:10000 google.cloud.aiplatform.container.v1.MatchService.Match 'deployed_index_id: "${DEPLOYED_INDEX_ID}", float_val: [1, 1], "sparse_embedding": {"values": [111.0,111.1,111.2], "dimensions": [10,20,30]}, numeric_restricts: [{name: "double-ns", value_double: 0.3, op: LESS_EQUAL}, {name: "double-ns", value_double: -1.2, op: GREATER}, {name: "double-ns", value_double: 0., op: NOT_EQUAL}], restricts: [{name: "color", allow_tokens: ["red"]}]'
Per saperne di più, vedi Descrizione delle librerie client.
Console
Segui queste istruzioni per eseguire query su un indice VPC dalla console.
- Nella sezione Vertex AI della console Google Cloud , vai alla sezione Deployment e utilizzo. Seleziona Vector Search.
- Seleziona l'indice VPC su cui vuoi eseguire una query. Viene visualizzata la pagina Informazioni indice.
- Scorri verso il basso fino alla sezione Indici implementati e seleziona l'indice implementato per cui vuoi eseguire la query. Viene visualizzata la pagina Informazioni sull'indice di cui è stato eseguito il deployment.
- Nella sezione Indice query, seleziona i parametri della query. Puoi scegliere di eseguire query in base a un vettore o a un punto dati specifico.
- Esegui la query utilizzando lo strumento open source grpc_cli o l'SDK Vertex AI per Python.
Impostazioni in fase di query che influiscono sul rendimento
I seguenti parametri di query possono influire su latenza, disponibilità e costo quando utilizzi la ricerca vettoriale. Queste indicazioni si applicano alla maggior parte dei casi. Tuttavia, sperimenta sempre le tue configurazioni per assicurarti che funzionino per il tuo caso d'uso.
Per le definizioni dei parametri, vedi Parametri di configurazione dell'indice.
Parametro | Informazioni | Impatto sulle prestazioni |
---|---|---|
approximateNeighborsCount |
Indica all'algoritmo il numero di risultati approssimativi da recuperare da ogni shard.
Il valore di
Il nome dell'API REST corrispondente per questo campo è
|
L'aumento del valore di
La riduzione del valore di
|
setNeighborCount |
Specifica il numero di risultati che vuoi che la query restituisca.
Il nome dell'API REST corrispondente per questo campo è
|
I valori inferiori o uguali a 300 rimangono efficienti nella maggior parte dei casi d'uso. Per valori più grandi, esegui il test per il tuo caso d'uso specifico. |
fractionLeafNodesToSearch |
Controlla la percentuale di nodi foglia da visitare durante la ricerca dei vicini più
prossimi. Questo è correlato a leafNodeEmbeddingCount in
in quanto più incorporamenti per nodo foglia, più dati vengono esaminati per foglia.
Il nome dell'API REST corrispondente per questo campo è
|
Aumentare il valore di
Diminuendo il valore di
|
Passaggi successivi
- Scopri come aggiornare e ricompilare l'indice
- Scopri come filtrare le corrispondenze vettoriali
- Scopri come monitorare un indice.