关于检索和排名

本页介绍了检索和排名如何协同工作,以在 Vertex AI Search 应用中提供相关搜索结果。

概览

简而言之,检索是查找相关文档,而排名是对检索到的文档进行排序。对所有可用文档进行排名在计算上可能非常耗时。因此,检索和排序是按顺序进行的。

首先,搜索模型会理解查询并对其进行重写。 然后,根据可用的数据源和数据存储区中已编入索引的文档数量,模型会检索数千个文档。系统会为检索到的文档分配相关性得分。

然后,排名模型会对检索到的文档进行排序,并提供排名前 400 的结果。下图展示了这两个流程如何融入搜索工作流。

搜索中的检索和排名
图 1. 搜索工作流程中的检索和排名

检索方法

检索是指从数据存储区中选择与用户查询相关的一部分文档的过程。Vertex AI Search 模型会根据各种信号(例如以下信号)管理搜索应用的检索,并分配相关性得分:

  • 主题性:包括关键字匹配、知识图谱和网络信号。

  • 嵌入:包括用于查找概念上相似内容的嵌入。

  • 交叉注意力:使模型能够考虑查询与文档之间的关系,从而为文档分配相关性得分。

  • 新鲜度:涉及确定数据存储区中文件的存在时间。

  • 用户事件:包括用于个性化的转化信号。

此外,在搜索请求中,您可以为网站数据结构化或非结构化数据提供相关性过滤条件和元数据过滤条件,以缩小相关文档的列表范围。

排名方法

排名会获取在检索阶段选择的文档,根据以下条件为其分配新的相关性得分,然后重新排序:

  • 提升:根据自定义属性或新鲜度来提升或降低某些结果的排名。这会影响前 1,000 个检索到的文档,并对前 400 个文档进行排名。 如需了解详情,请参阅提升搜索结果
  • 自定义排名:使用基于公式的排名算法来控制、调整和替换默认排名逻辑,以满足您的特定要求。 在提供结果时,自定义排名分配的相关性得分具有优先权。如需了解详情,请参阅自定义搜索结果排名
  • 搜索调优:影响模型对文档语义相关性的感知,并更改嵌入相关性得分。如需了解详情,请参阅利用搜索调参,提高搜索结果的准确性
  • 基于事件的重新排名:在提供结果时,使用基于用户事件的个性化模型更新结果。