Diese Seite wurde von der Cloud Translation API übersetzt.

Öffentlichen Index abfragen, um nächste Nachbarn abzurufen

Nachdem Sie den Index erstellt und bereitgestellt haben, können Sie Abfragen ausführen, um die nächstgelegenen Nachbarn abzurufen.

Im Folgenden finden Sie einige Beispiele für die Übereinstimmungsabfrage, um die nächstgelegenen Nachbarn mit dem Algorithmus „k-Nearest Neighbor“ (k-NN) zu finden.

Beispielabfragen für öffentliche Endpunkte

Python

Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Python-API-Referenzdokumentation.

def vector_search_find_neighbors(
    project: str,
    location: str,
    index_endpoint_name: str,
    deployed_index_id: str,
    queries: List[List[float]],
    num_neighbors: int,
) -> List[
    List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]
]:
    """Query the vector search index.

    Args:
        project (str): Required. Project ID
        location (str): Required. The region name
        index_endpoint_name (str): Required. Index endpoint to run the query
        against.
        deployed_index_id (str): Required. The ID of the DeployedIndex to run
        the queries against.
        queries (List[List[float]]): Required. A list of queries. Each query is
        a list of floats, representing a single embedding.
        num_neighbors (int): Required. The number of neighbors to return.

    Returns:
        List[List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]] - A list of nearest neighbors for each query.
    """
    # Initialize the Vertex AI client
    aiplatform.init(project=project, location=location)

    # Create the index endpoint instance from an existing endpoint.
    my_index_endpoint = aiplatform.MatchingEngineIndexEndpoint(
        index_endpoint_name=index_endpoint_name
    )

    # Query the index endpoint for the nearest neighbors.
    return my_index_endpoint.find_neighbors(
        deployed_index_id=deployed_index_id,
        queries=queries,
        num_neighbors=num_neighbors,
    )

Befehlszeile

Den unten aufgeführten publicEndpointDomainName finden Sie unter Bereitstellen. Er hat folgendes Format: <number>.<region>-<number>.vdb.vertexai.goog


  $ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312:findNeighbors -d '{deployed_index_id: "test_index_public1", queries: [{datapoint: {datapoint_id: "0", feature_vector: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}, neighbor_count: 5}]}'

Dieses curl-Beispiel zeigt, wie von http(s)-Clients aus aufgerufen wird. Allerdings unterstützt der öffentliche Endpunkt ein Dual-Protokoll für RESTful und grpc_cli.


  $ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/${PROJECT_ID}/locations/us-central1/indexEndpoints/${INDEX_ENDPOINT_ID}:readIndexDatapoints -d '{deployed_index_id:"test_index_public1", ids: ["606431", "896688"]}'

Dieses curl-Beispiel zeigt, wie Sie mit Token- und numerischen Einschränkungen abfragen.


  $ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`"  https://${PUBLIC_ENDPOINT_DOMAIN}/v1/projects/${PROJECT_ID}/locations/${LOCATION}/indexEndpoints/${INDEX_ENDPOINT_ID}:findNeighbors -d '{deployed_index_id:"${DEPLOYED_INDEX_ID}", queries: [{datapoint: {datapoint_id:"x", feature_vector: [1, 1], "sparse_embedding": {"values": [111.0,111.1,111.2], "dimensions": [10,20,30]}, numeric_restricts: [{namespace: "int-ns", value_int: -2, op: "GREATER"}, {namespace: "int-ns", value_int: 4, op: "LESS_EQUAL"}, {namespace: "int-ns", value_int: 0, op: "NOT_EQUAL"}], restricts: [{namespace: "color", allow_list: ["red"]}]}}]}'

Console

Folgen Sie dieser Anleitung, um einen Index, der auf einem öffentlichen Endpunkt bereitgestellt ist, über die Console abzufragen.

Wechseln Sie im Abschnitt „Vertex AI“ der Google Cloud Console zum Abschnitt Bereitstellen und verwenden. Wählen Sie Vektorsuche aus.
Zur Vektorsuche
Wählen Sie den Index aus, den Sie abfragen möchten. Die Seite Indexinformationen wird geöffnet.
Scrollen Sie nach unten zum Bereich Bereitgestellte Indexe und wählen Sie den bereitgestellten Index aus, den Sie abfragen möchten. Die Seite Informationen zum bereitgestellten Index wird geöffnet.
Wählen Sie im Abschnitt Query index (Index abfragen) aus, ob Sie nach einem dichten Einbettungswert, einem dünnbesetzten Einbettungswert, einem hybriden Einbettungswert (dichte und dünnbesetzte Einbettungen) oder einem bestimmten Datenpunkt suchen möchten.
Geben Sie die Suchparameter für den ausgewählten Abfragetyp ein. Wenn Sie beispielsweise eine Abfrage mit einer dichten Einbettung ausführen, geben Sie den Einbettungsvektor ein, mit dem die Abfrage ausgeführt werden soll.
Führen Sie die Abfrage mit dem bereitgestellten curl-Befehl oder mit Cloud Shell aus.
Wenn Sie Cloud Shell verwenden, wählen Sie In Cloud Shell ausführen aus.
In Cloud Shell ausführen
Die Ergebnisse geben die nächsten Nachbarn zurück.

Hybridanfragen

Bei der Hybridsuche werden sowohl dichte als auch dünnbesetzte Einbettungen für Suchanfragen verwendet, die auf einer Kombination aus Stichwortsuche und semantischer Suche basieren.

Python

Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Python-API-Referenzdokumentation.

def vector_search_find_neighbors_hybrid_queries(
    project: str,
    location: str,
    index_endpoint_name: str,
    deployed_index_id: str,
    num_neighbors: int,
) -> List[
    List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]
]:
    """Query the vector search index using example hybrid queries.

    Args:
        project (str): Required. Project ID
        location (str): Required. The region name
        index_endpoint_name (str): Required. Index endpoint to run the query
        against.
        deployed_index_id (str): Required. The ID of the DeployedIndex to run
        the queries against.
        num_neighbors (int): Required. The number of neighbors to return.

    Returns:
        List[List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]] - A list of nearest neighbors for each query.
    """
    # Initialize the Vertex AI client
    aiplatform.init(project=project, location=location)

    # Create the index endpoint instance from an existing endpoint.
    my_index_endpoint = aiplatform.MatchingEngineIndexEndpoint(
        index_endpoint_name=index_endpoint_name
    )

    # Query hybrid datapoints, sparse-only datapoints, and dense-only datapoints.
    hybrid_queries = [
        aiplatform.matching_engine.matching_engine_index_endpoint.HybridQuery(
            dense_embedding=[1, 2, 3],
            sparse_embedding_dimensions=[10, 20, 30],
            sparse_embedding_values=[1.0, 1.0, 1.0],
            rrf_ranking_alpha=0.5,
        ),
        aiplatform.matching_engine.matching_engine_index_endpoint.HybridQuery(
            dense_embedding=[1, 2, 3],
            sparse_embedding_dimensions=[10, 20, 30],
            sparse_embedding_values=[0.1, 0.2, 0.3],
        ),
        aiplatform.matching_engine.matching_engine_index_endpoint.HybridQuery(
            sparse_embedding_dimensions=[10, 20, 30],
            sparse_embedding_values=[0.1, 0.2, 0.3],
        ),
        aiplatform.matching_engine.matching_engine_index_endpoint.HybridQuery(
            dense_embedding=[1, 2, 3]
        ),
    ]

    return my_index_endpoint.find_neighbors(
        deployed_index_id=deployed_index_id,
        queries=hybrid_queries,
        num_neighbors=num_neighbors,
    )

Abfragen mit Filterung und Crowding

Mit Vektorübereinstimmungen filtern können Sie die Ergebnisse der Suche nach dem nächsten Nachbarn auf bestimmte Kategorien beschränken. Mit Filtern können Sie auch Kategorien festlegen, die aus Ihren Ergebnissen ausgeschlossen werden sollen.

Limits für benachbarte Elemente pro Crowding-Tag können die Vielfalt der Ergebnisse erhöhen, indem die Anzahl der Ergebnisse begrenzt wird, die für ein einzelnes Crowding-Tag in Ihren Indexdaten zurückgegeben werden.

Python

Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Python-API-Referenzdokumentation.

def vector_search_find_neighbors_filtering_crowding(
    project: str,
    location: str,
    index_endpoint_name: str,
    deployed_index_id: str,
    queries: List[List[float]],
    num_neighbors: int,
    filter: List[aiplatform.matching_engine.matching_engine_index_endpoint.Namespace],
    numeric_filter: List[
        aiplatform.matching_engine.matching_engine_index_endpoint.NumericNamespace
    ],
    per_crowding_attribute_neighbor_count: int,
) -> List[
    List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]
]:
    """Query the vector search index with filtering and crowding.

    Args:
        project (str): Required. Project ID
        location (str): Required. The region name
        index_endpoint_name (str): Required. Index endpoint to run the query
        against.
        deployed_index_id (str): Required. The ID of the DeployedIndex to run
        the queries against.
        queries (List[List[float]]): Required. A list of queries. Each query is
        a list of floats, representing a single embedding.
        num_neighbors (int): Required. The number of neighbors to return.
        filter (List[Namespace]): Required. A list of Namespaces for filtering
        the matching results. For example,
        [Namespace("color", ["red"], []), Namespace("shape", [], ["square"])]
        will match datapoints that satisfy "red color" but not include
        datapoints with "square shape".
        numeric_filter (List[NumericNamespace]): Required. A list of
        NumericNamespaces for filtering the matching results. For example,
        [NumericNamespace(name="cost", value_int=5, op="GREATER")] will limit
        the matching results to datapoints with cost greater than 5.
        per_crowding_attribute_neighbor_count (int): Required. The maximum
        number of returned matches with the same crowding tag.

    Returns:
        List[List[aiplatform.matching_engine.matching_engine_index_endpoint.MatchNeighbor]] - A list of nearest neighbors for each query.
    """
    # Initialize the Vertex AI client
    aiplatform.init(project=project, location=location)

    # Create the index endpoint instance from an existing endpoint.
    my_index_endpoint = aiplatform.MatchingEngineIndexEndpoint(
        index_endpoint_name=index_endpoint_name
    )

    # Query the index endpoint for the nearest neighbors.
    return my_index_endpoint.find_neighbors(
        deployed_index_id=deployed_index_id,
        queries=queries,
        num_neighbors=num_neighbors,
        filter=filter,
        numeric_filter=numeric_filter,
        per_crowding_attribute_neighbor_count=per_crowding_attribute_neighbor_count,
    )

Einstellungen beim Abfragezeitpunkt, die sich auf die Leistung auswirken

Die folgenden Parameter für die Abfragezeit können sich bei der Verwendung der Vektorsuche auf Latenz, Verfügbarkeit und Kosten auswirken. Diese Empfehlung gilt in den meisten Fällen. Testen Sie jedoch immer mit Ihren Konfigurationen, ob sie sich für Ihren Anwendungsfall eignen.

Informationen zu Parameterdefinitionen finden Sie unter Parameter für die Indexkonfiguration.

Parameter Info Auswirkungen auf die Leistung

Parameter	Info	Auswirkungen auf die Leistung
`approximateNeighborsCount`	Gibt dem Algorithmus die Anzahl der ungefähren Ergebnisse an, die von jedem Shard abgerufen werden sollen. Der Wert von `approximateNeighborsCount` sollte immer größer als der Wert von `setNeighborsCount` sein. Wenn der Wert von `setNeighborsCount` klein ist, wird für `approximateNeighborsCount` das 10-Fache dieses Werts empfohlen. Für größere `setNeighborsCount`-Werte kann ein kleinerer Multiplikator verwendet werden. Der entsprechende REST API-Name für dieses Feld ist `approximate_neighbor_count`.	Das Erhöhen des Werts von `approximateNeighborsCount` kann sich auf folgende Weise auf die Leistung auswirken: Recall: Erhöht Latenz: Möglicherweise erhöht Verfügbarkeit: Keine Auswirkung Kosten: Kann steigen, da während einer Suche mehr Daten verarbeitet werden Wenn Sie den Wert von `approximateNeighborsCount` verringern, kann sich das so auf die Leistung auswirken: Recall: Verringert Latenz: Verringert sich möglicherweise Verfügbarkeit: Keine Auswirkung Kosten: Kann die Kosten senken, da während einer Suche weniger Daten verarbeitet werden
`setNeighborCount`	Gibt die Anzahl der Ergebnisse an, die durch die Abfrage zurückgegeben werden sollen. Der entsprechende REST API-Name für dieses Feld ist `neighbor_count`.	Werte unter oder gleich 300 bleiben in den meisten Anwendungsfällen leistungsfähig. Bei größeren Werten sollten Sie für Ihren spezifischen Anwendungsfall testen.
`fractionLeafNodesToSearch`	Steuert den Prozentsatz der Blattknoten, die bei der Suche nach nächsten Nachbarn besucht werden. Dies steht in Bezug auf `leafNodeEmbeddingCount` insofern, als je mehr Einbettungen pro Blattknoten umso mehr Daten pro Blatt untersucht werden. Der entsprechende REST API-Name für dieses Feld ist `fraction_leaf_nodes_to_search_override`.	Das Erhöhen des Werts von `fractionLeafNodesToSearch` kann die Leistung auf folgende Weise beeinflussen: Recall: Erhöht Latenz: Erhöht Verfügbarkeit: Keine Auswirkung Kosten: Kann steigen, da eine höhere Latenz mehr Maschinenressourcen belegt Das Verringern des Werts von `fractionLeafNodesToSearch` kann sich auf folgende Weise auf die Leistung auswirken: Recall: Verringert Latenz: Verringert Verfügbarkeit: Keine Auswirkung Kosten: Kann sich verringern, da eine geringere Latenz weniger Maschinenressourcen belegt

approximateNeighborsCount

Gibt dem Algorithmus die Anzahl der ungefähren Ergebnisse an, die von jedem Shard abgerufen werden sollen.

Der Wert von approximateNeighborsCount sollte immer größer als der Wert von setNeighborsCount sein. Wenn der Wert von setNeighborsCount klein ist, wird für approximateNeighborsCount das 10-Fache dieses Werts empfohlen. Für größere setNeighborsCount-Werte kann ein kleinerer Multiplikator verwendet werden.

Der entsprechende REST API-Name für dieses Feld ist approximate_neighbor_count.

Das Erhöhen des Werts von approximateNeighborsCount kann sich auf folgende Weise auf die Leistung auswirken:

Recall: Erhöht
Latenz: Möglicherweise erhöht
Verfügbarkeit: Keine Auswirkung
Kosten: Kann steigen, da während einer Suche mehr Daten verarbeitet werden

Wenn Sie den Wert von approximateNeighborsCount verringern, kann sich das so auf die Leistung auswirken:

Recall: Verringert
Latenz: Verringert sich möglicherweise
Verfügbarkeit: Keine Auswirkung
Kosten: Kann die Kosten senken, da während einer Suche weniger Daten verarbeitet werden

setNeighborCount

Gibt die Anzahl der Ergebnisse an, die durch die Abfrage zurückgegeben werden sollen.

Der entsprechende REST API-Name für dieses Feld ist neighbor_count.

Werte unter oder gleich 300 bleiben in den meisten Anwendungsfällen leistungsfähig. Bei größeren Werten sollten Sie für Ihren spezifischen Anwendungsfall testen.

fractionLeafNodesToSearch

Steuert den Prozentsatz der Blattknoten, die bei der Suche nach nächsten Nachbarn besucht werden. Dies steht in Bezug auf leafNodeEmbeddingCount insofern, als je mehr Einbettungen pro Blattknoten umso mehr Daten pro Blatt untersucht werden.

Der entsprechende REST API-Name für dieses Feld ist fraction_leaf_nodes_to_search_override.

Das Erhöhen des Werts von fractionLeafNodesToSearch kann die Leistung auf folgende Weise beeinflussen:

Recall: Erhöht
Latenz: Erhöht
Verfügbarkeit: Keine Auswirkung
Kosten: Kann steigen, da eine höhere Latenz mehr Maschinenressourcen belegt

Das Verringern des Werts von fractionLeafNodesToSearch kann sich auf folgende Weise auf die Leistung auswirken:

Recall: Verringert
Latenz: Verringert
Verfügbarkeit: Keine Auswirkung
Kosten: Kann sich verringern, da eine geringere Latenz weniger Maschinenressourcen belegt