通过 Vector Search 互动式演示,体验先进的向量搜索技术的强大功能。该演示利用真实数据集提供了一个现实示例,可帮助您了解矢量搜索的运作方式、探索语义搜索和混合搜索,以及查看重新排名的运作方式。提交动物、植物、电子商务商品或其他物品的简短说明,然后交由向量搜索来完成剩余的工作!
试试看!
在演示版中试用不同的选项,抢先了解 Vector Search 并掌握向量搜索技术的基础知识。
如需运行,请执行以下操作:
在查询文本字段中,描述您要查询的项(例如
vintage 1970s pinball machine
)。或者,点击生成查询以自动生成说明。点击提交。
如需详细了解您可以在演示版中执行的操作,请参阅界面。
界面
本部分介绍了界面中的设置,您可以使用这些设置来控制 Vector Search 返回的结果以及结果的排名方式。
数据集
使用数据集下拉菜单选择 Vector Search 将针对哪个数据集运行查询。如需详细了解每种数据集,请参阅数据集。
查询
在查询字段中,添加说明或一个或多个关键字,以指定您希望矢量搜索功能查找的内容。或者,点击生成查询以自动生成说明。
修改
您可以通过以下几种方式修改矢量搜索返回的结果:
点击行,然后选择您希望矢量搜索返回的搜索结果的数量上限。
如果您希望 Vector Search 返回语义上相似的结果,请选择使用密集嵌入。
如果您希望 Vector Search 根据查询的文本语法返回结果,请选择使用稀疏嵌入。并非所有可用数据集都支持稀疏嵌入模型。
如果您希望 Vector Search 使用混合搜索,请同时选择使用密集嵌入和使用稀疏嵌入。并非所有数据集都支持此模型。混合搜索会结合使用密集嵌入和稀疏嵌入的元素,从而提高搜索结果的质量。如需了解详情,请参阅混合搜索简介。
在 RRF Alpha 字段中,输入介于 0.0 和 1.0 之间的值,以指定 RRF 排名效果。
如需重新排名搜索结果,请从重新排名下拉菜单中选择 ranking_api,或选择 None 以停用重新排名。
指标
查询运行后,系统会提供延迟时间指标,其中会按不同搜索阶段对完成所需时间进行细分。
查询流程
处理查询时,会发生以下情况:
查询嵌入生成:为指定的查询文本生成嵌入。
Vector Search 查询:使用 Vector Search 索引运行查询。
Vertex AI Feature Store 提取:使用向量搜索返回的商品 ID 列表从 Vertex AI Feature Store 读取特征(例如商品名称、说明或图片网址)。
重新排名:系统会通过排名 API 对检索到的项进行排序,该 API 会使用查询文本、项名称和项说明来计算相关性得分。
Embeddings
多模态:对商品图片进行多模态语义搜索。有关详情,请参阅什么是多模式搜索:“有远见的法学硕士”改变业务。
文本(语义相似度):根据语义相似度对商品名称和说明进行文本语义搜索。如需了解详情,请参阅 Vertex AI Embeddings for Text:轻松使用 LLM。
文本(问答):对商品名称和说明进行文本语义搜索,并根据任务类型 QUESTION_ANSWERING 改进搜索质量。这适用于问答类型的应用。如需了解任务类型嵌入,请参阅使用 Vertex AI 嵌入和任务类型增强您的生成式 AI 用例。
稀疏(混合搜索):对商品名和说明进行基于关键字(基于令牌)的搜索,使用 TF-IDF 算法生成。如需了解详情,请参阅混合搜索简介。
数据集
互动式演示包含多个可用于运行查询的数据集。数据集因嵌入模型、对稀疏嵌入的支持、嵌入维度和存储项数量而异。
数据集 | 嵌入式模型 | 稀疏嵌入模型 | 嵌入维度 | 项数 |
---|---|---|---|---|
Mercari 多模态 + 稀疏嵌入 | 多模态嵌入 | TF-IDF (商品名称和说明) |
1408 | 约 300 万 |
Mercari 文本(语义相似度)+ 稀疏嵌入 | text-embedding-005 ) (任务类型:SEMANTIC_SIMILARITY) |
TF-IDF (商品名称和说明) |
768 | 约 300 万 |
Mercari Text(问答)+ 稀疏嵌入 | text-embedding-005 ) (任务类型:QUESTION_ANSWERING) |
TF-IDF (商品名称和说明) |
768 | 约 300 万 |
GBIF 花卉多模态 + 稀疏嵌入 | 多模态嵌入 | TF-IDF (商品名称和说明) |
1408 | 约 330 万 |
GBIF 动物多模态嵌入 | 多模态嵌入 | 不适用 | 1408 | 约 700 万 |
后续步骤
现在,您已经熟悉了演示,可以更深入地了解如何使用 Vector Search 了。