Nachdem Sie den Index erstellt und bereitgestellt haben, können Sie Abfragen ausführen, um die nächsten Nachbarn zu ermitteln.
Im Folgenden finden Sie einige Beispiele für die Übereinstimmungsabfrage, um die nächstgelegenen Nachbarn mit dem Algorithmus „k-Nearest Neighbor“ (k-NN) zu finden.
Beispielabfragen für öffentliche Endpunkte
Python
Python
Curl
Den unten aufgeführten publicEndpointDomainName
finden Sie unter
Bereitstellen. Er hat folgendes Format:
<number>.<region>-<number>.vdb.vertexai.goog
$ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312:findNeighbors -d '{deployed_index_id: "test_index_public1", queries: [{datapoint: {datapoint_id: "0", feature_vector: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}, neighbor_count: 5}]}'
Dieses curl-Beispiel zeigt, wie von http(s)
-Clients aus aufgerufen wird.
Allerdings unterstützt der öffentliche Endpunkt ein Dual-Protokoll für RESTful und grpc_cli
.
$ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/${PROJECT_ID}/locations/us-central1/indexEndpoints/${INDEX_ENDPOINT_ID}:readIndexDatapoints -d '{deployed_index_id:"test_index_public1", ids: ["606431", "896688"]}'
Dieses curl-Beispiel zeigt, wie eine Abfrage mit Token- und numerischen Einschränkungen durchgeführt wird.
$ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://${PUBLIC_ENDPOINT_DOMAIN}/v1/projects/${PROJECT_ID}/locations/${LOCATION}/indexEndpoints/${INDEX_ENDPOINT_ID}:findNeighbors -d '{deployed_index_id:"${DEPLOYED_INDEX_ID}", queries: [{datapoint: {datapoint_id:"x", feature_vector: [1, 1], "sparse_embedding": {"values": [111.0,111.1,111.2], "dimensions": [10,20,30]}, numeric_restricts: [{namespace: "int-ns", value_int: -2, op: "GREATER"}, {namespace: "int-ns", value_int: 4, op: "LESS_EQUAL"}, {namespace: "int-ns", value_int: 0, op: "NOT_EQUAL"}], restricts: [{namespace: "color", allow_list: ["red"]}]}}]}'
Console
Folgen Sie dieser Anleitung, um einen Index, der auf einem öffentlichen Endpunkt bereitgestellt ist, über die Console abzufragen.
- Wechseln Sie im Abschnitt „Vertex AI“ der Google Cloud Console zum Abschnitt Bereitstellen und verwenden. Wählen Sie Vektorsuche.
- Wählen Sie den Index aus, den Sie abfragen möchten. Die Seite Indexinformationen wird geöffnet.
- Scrollen Sie nach unten zum Abschnitt Bereitgestellte Indexe und wählen Sie den bereitgestellten Index aus, den Sie abfragen möchten. Die Seite Informationen zum bereitgestellten Index wird geöffnet.
- Wählen Sie im Bereich Abfrageindex aus, ob die Abfrage nach einem dichten Einbettungswert, einem dünnbesetzten Einbettungswert, einem hybriden Einbettungswert (dichte und dünnbesetzte Einbettungen) oder einem bestimmten Datenpunkt erfolgen soll.
- Geben Sie die Suchparameter für den ausgewählten Abfragetyp ein. Wenn Sie beispielsweise eine dichte Einbettung verwenden, geben Sie den Einbettungsvektor ein, nach dem die Abfrage durchgeführt werden soll.
- Führen Sie die Abfrage mit dem bereitgestellten curl-Befehl oder mit Cloud Shell aus.
- Wenn Sie Cloud Shell verwenden, wählen Sie In Cloud Shell ausführen aus.
- In Cloud Shell ausführen
- Die Ergebnisse geben die nächsten Nachbarn zurück.
Ein End-to-End-Beispiel als Anleitung zum Erstellen eines Index, zum Bereitstellen auf einem öffentlichen Endpunkt und zum Abfragen finden Sie im offiziellen Notebook: Vektorsuche und Vertex AI Embeddings für Text bei StackOverflow-Fragen verwenden.
Einstellungen beim Abfragezeitpunkt, die sich auf die Leistung auswirken
Die folgenden Parameter für die Abfragezeit können sich bei der Verwendung der Vektorsuche auf Latenz, Verfügbarkeit und Kosten auswirken. Diese Empfehlung gilt in den meisten Fällen. Testen Sie jedoch immer mit Ihren Konfigurationen, ob sie sich für Ihren Anwendungsfall eignen.
Informationen zu Parameterdefinitionen finden Sie unter Parameter für die Indexkonfiguration.
Parameter | Info | Auswirkungen auf die Leistung |
---|---|---|
approximateNeighborsCount |
Gibt dem Algorithmus die Anzahl der ungefähren Ergebnisse an, die von jedem Shard abgerufen werden sollen.
Der Wert von |
Das Erhöhen des Werts von
Wenn Sie den Wert von
|
setNeighborCount |
Gibt die Anzahl der Ergebnisse an, die durch die Abfrage zurückgegeben werden sollen. |
Werte unter oder gleich 300 bleiben in den meisten Anwendungsfällen leistungsfähig. Bei größeren Werten sollten Sie für Ihren spezifischen Anwendungsfall testen. |
fractionLeafNodesToSearch |
Steuert den Prozentsatz der Blattknoten, die bei der Suche nach nächsten Nachbarn besucht werden. Dies steht in Bezug auf leafNodeEmbeddingCount insofern, als je mehr Einbettungen pro Blattknoten umso mehr Daten pro Blatt untersucht werden.
|
Das Erhöhen des Werts von
Das Verringern des Werts von
|
Nächste Schritte
- Index aktualisieren und neu erstellen
- Weitere Informationen zum Filtern von Vektorübereinstimmungen
- Index beobachten