互动演示

通过 Vector Search 互动式演示,体验先进的向量搜索技术的强大功能。该演示利用真实数据集提供了一个现实示例,可帮助您了解矢量搜索的运作方式、探索语义搜索和混合搜索,以及查看重新排名的运作方式。提交动物、植物、电子商务商品或其他物品的简短说明,然后交由向量搜索来完成剩余的工作!


使用 Vector Search 互动式实时演示查询结果

试试看!

在演示版中试用不同的选项,抢先了解 Vector Search 并掌握向量搜索技术的基础知识。

如需运行,请执行以下操作:

  1. 查询文本字段中,描述您要查询的项(例如 vintage 1970s pinball machine)。或者,点击生成查询以自动生成说明。

  2. 点击提交

如需详细了解您可以在演示版中执行的操作,请参阅界面


界面

本部分介绍了界面中的设置,您可以使用这些设置来控制 Vector Search 返回的结果以及结果的排名方式。


数据集

使用数据集下拉菜单选择 Vector Search 将针对哪个数据集运行查询。如需详细了解每种数据集,请参阅数据集

使用 Vector Search 互动式实时演示查询结果


查询

查询字段中,添加说明或一个或多个关键字,以指定您希望矢量搜索功能查找的内容。或者,点击生成查询以自动生成说明。

创建或自动生成 Vector Search 查询


修改

您可以通过以下几种方式修改矢量搜索返回的结果:

Vector Search 互动式实时演示的界面设置

  • 点击,然后选择您希望矢量搜索返回的搜索结果的数量上限。

  • 如果您希望 Vector Search 返回语义上相似的结果,请选择使用密集嵌入

  • 如果您希望 Vector Search 根据查询的文本语法返回结果,请选择使用稀疏嵌入。并非所有可用数据集都支持稀疏嵌入模型。

  • 如果您希望 Vector Search 使用混合搜索,请同时选择使用密集嵌入使用稀疏嵌入。并非所有数据集都支持此模型。混合搜索会结合使用密集嵌入和稀疏嵌入的元素,从而提高搜索结果的质量。如需了解详情,请参阅混合搜索简介

  • RRF Alpha 字段中,输入介于 0.0 和 1.0 之间的值,以指定 RRF 排名效果。

  • 如需重新排名搜索结果,请从重新排名下拉菜单中选择 ranking_api,或选择 None 以停用重新排名。


指标

查询运行后,系统会提供延迟时间指标,其中会按不同搜索阶段对完成所需时间进行细分。

Vector Search 互动式实时演示的查询指标


查询流程

处理查询时,会发生以下情况:

  1. 查询嵌入生成:为指定的查询文本生成嵌入。

  2. Vector Search 查询:使用 Vector Search 索引运行查询。

  3. Vertex AI Feature Store 提取:使用向量搜索返回的商品 ID 列表从 Vertex AI Feature Store 读取特征(例如商品名称、说明或图片网址)。

  4. 重新排名:系统会通过排名 API 对检索到的项进行排序,该 API 会使用查询文本、项名称和项说明来计算相关性得分。

Embeddings

多模态:对商品图片进行多模态语义搜索。有关详情,请参阅什么是多模式搜索:“有远见的法学硕士”改变业务

文本(语义相似度):根据语义相似度对商品名称和说明进行文本语义搜索。如需了解详情,请参阅 Vertex AI Embeddings for Text:轻松使用 LLM

文本(问答):对商品名称和说明进行文本语义搜索,并根据任务类型 QUESTION_ANSWERING 改进搜索质量。这适用于问答类型的应用。如需了解任务类型嵌入,请参阅使用 Vertex AI 嵌入和任务类型增强您的生成式 AI 用例

稀疏(混合搜索):对商品名和说明进行基于关键字(基于令牌)的搜索,使用 TF-IDF 算法生成。如需了解详情,请参阅混合搜索简介

数据集

互动式演示包含多个可用于运行查询的数据集。数据集因嵌入模型、对稀疏嵌入的支持、嵌入维度和存储项数量而异。

数据集 嵌入式模型 稀疏嵌入模型 嵌入维度 项数
Mercari 多模态 + 稀疏嵌入 多模态嵌入 TF-IDF
(商品名称和说明)
1408 约 300 万
Mercari 文本(语义相似度)+ 稀疏嵌入 text-embedding-005)
(任务类型:SEMANTIC_SIMILARITY)
TF-IDF
(商品名称和说明)
768 约 300 万
Mercari Text(问答)+ 稀疏嵌入 text-embedding-005)
(任务类型:QUESTION_ANSWERING)
TF-IDF
(商品名称和说明)
768 约 300 万
GBIF 花卉多模态 + 稀疏嵌入 多模态嵌入 TF-IDF
(商品名称和说明)
1408 约 330 万
GBIF 动物多模态嵌入 多模态嵌入 不适用 1408 约 700 万

后续步骤

现在,您已经熟悉了演示,可以更深入地了解如何使用 Vector Search 了。

  • 快速入门:使用示例数据集在 30 分钟内创建和部署索引。

  • 准备工作:了解如何准备嵌入,并确定要将索引部署到哪种类型的端点。