

以下是匹配查询的一些示例,这些查询使用 k 最近邻算法 (k-NN) 查找最近邻。




def vector_search_find_neighbors(
    project: str,
    location: str,
    index_endpoint_name: str,
    deployed_index_id: str,
    queries: List[List[float]],
    num_neighbors: int,
) -> None:
    """Query the vector search index.

        project (str): Required. Project ID
        location (str): Required. The region name
        index_endpoint_name (str): Required. Index endpoint to run the query
        deployed_index_id (str): Required. The ID of the DeployedIndex to run
        the queries against.
        queries (List[List[float]]): Required. A list of queries. Each query is
        a list of floats, representing a single embedding.
        num_neighbors (int): Required. The number of neighbors to return.
    # Initialize the Vertex AI client
    aiplatform.init(project=project, location=location)

    # Create the index endpoint instance from an existing endpoint.
    my_index_endpoint = aiplatform.MatchingEngineIndexEndpoint(

    # Query the index endpoint for the nearest neighbors.
    resp = my_index_endpoint.find_neighbors(


您可以在部署中找到下面列出的 publicEndpointDomainName

  $ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312:findNeighbors -d '{deployed_index_id: "test_index_public1", queries: [{datapoint: {datapoint_id: "0", feature_vector: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}, neighbor_count: 5}]}'

此 curl 示例展示了如何从 http(s) 客户端进行调用,虽然公共端点支持 RESTful 和 grpc_cli 的双协议。

  $ curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" https://1957880287.us-central1-181224308459.vdb.vertexai.goog/v1/projects/${PROJECT_ID}/locations/us-central1/indexEndpoints/${INDEX_ENDPOINT_ID}:readIndexDatapoints -d '{deployed_index_id:"test_index_public1", ids: ["606431", "896688"]}'



  1. 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search

  2. 选择要查询的索引。此时会打开索引信息页面。
  3. 向下滚动到已部署的索引部分,然后选择要查询的已部署索引。此时会打开已部署的索引信息页面。
  4. 查询索引部分中,选择查询参数。您可以选择按向量或特定数据点进行查询。
  5. 使用提供的 curl 命令或使用 Cloud Shell 运行来执行查询。
  6. 如果使用 Cloud Shell,请选择在 Cloud Shell 中运行
  7. 在 Cloud Shell 中运行。
  8. 结果会返回最近邻。

如需查看端到端示例,了解如何创建索引、如何将其部署到公共端点以及如何查询,请参阅官方笔记本:使用 Vector Search 和 Vertex AI Embeddings for Text 处理 StackOverflow 问题


使用 Vector Search 时,以下查询时参数可能会影响延迟时间、可用性和费用。本指南适用于大多数情况。 但是,请始终对您的配置进行实验,以确保它们适用于您的用例。


参数 简介 性能影响
approximateNeighborsCount 告知算法要从每个分片中检索的近似结果数。

增加 approximateNeighborsCount 的值可能会通过以下方式影响性能:

  • 召回率:提高了
  • 延迟时间:可能增加
  • 可用性:无影响
  • 费用:可能会增加,因为搜索期间处理的数据会更多

降低 approximateNeighborsCount 的值可能会通过以下方式影响性能:

  • 召回率:降低
  • 延迟时间:可能会缩短
  • 可用性:无影响
  • 费用:可以降低费用,因为搜索期间处理的数据量较少
setNeighborCount 指定您希望查询返回的结果数。

在大多数用例中,小于或等于 300 的值仍然保持高性能。 对于较大的值,请针对具体用例进行测试。

approximateNeighborsCount 应始终大于 setNeighborsCount。如果 setNeighborsCount 的值较小,则建议为 approximateNeighborsCount 使用该值的 10 倍。对于较大的 setNeighborsCount 值,可以使用较小的乘数。

fractionLeafNodesToSearch 控制搜索最近邻时要访问的叶节点的百分比。这与 leafNodeEmbeddingCount 相关,因为每个叶节点的嵌入越多,每个叶节点检查的数据就越多。

增加 fractionLeafNodesToSearch 的值可通过以下方式影响性能:

  • 召回率:提高了
  • 延迟时间:增加
  • 可用性:无影响
  • 费用:可能会增加,因为延迟时间较长会占用更多的机器资源

降低 fractionLeafNodesToSearch 的值可能会通过以下方式影响性能:

  • 召回率:降低
  • 延迟时间:缩短
  • 可用性:无影响
  • 费用:可能会降低,因为较短的延迟时间会占用较少的机器资源
