搜索自动补全

本页介绍自动补全功能及其使用方法。Search 提供自动补全功能,用于强化搜索框的预输入建议。

自动补全功能用于预测用户正在输入的查询的其余部分,从而改善用户搜索体验,并加快结账前的购物流程。它还可以通过提供格式良好的查询来提高搜索响应质量,从而创造更高的收入。

概览

当最终用户在您的网站上开始输入搜索字词时,搜索可以提供该用户可能需要的建议列表。例如,当用户输入 sh 时,系统可能会建议输入鞋子衬衫

数据源

您可以为建议预测选择以下数据源之一:

  • 您上传的 BigQuery 数据集。
  • 一种使用机器学习技术根据用户事件和其他元数据生成的数据集。

已上传的数据集

您上传的 BigQuery 建议表(以数据集的形式),用于建议查询。如需了解如何上传数据集,请参阅导入自动补全数据

自动学习数据集

由搜索功能根据用户搜索事件生成的机器学习支持的建议数据集。

如需启用自动学习功能,请执行以下操作:

Cloud 控制台

  1. 转到“控件”页面

  2. 前往自动补全控件标签页。

  3. 点击修改设置

  4. 开启自动学习

  5. 点击保存设置

    自动学习功能可能需要 1-2 天才能更新。

cURL

curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  "https://retail.googleapis.com/v2beta/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionConfig?update_mask.paths=auto_learning"  --data "{auto_learning: true}"

自动学习数据集前提条件

自动学习功能会根据搜索型用户事件 (eventType = "search") 生成建议。生成过程会使用过去 180 天内的用户事件。 它需要导入大量优质的用户事件。

自动学习会过滤掉罕见的建议,因此如果搜索类型用户事件数量太少(少于 20,000),则可能会过滤掉许多建议候选对象。在这种情况下,您可能需要先使用更频繁的搜索查询来测试自动补全功能。

自动学习数据集发布时间表

自动学习数据集每天生成一次,然后推送到索引和发布。整个周期大约需要两天时间。

自动学习功能

搜索功能仅将机器学习技术应用于清理和格式化自动学习数据集的搜索查询和建议数据。

功能 说明 示例
移除零结果搜索
  • 移除搜索结果为零的查询。
对于杂货零售商,Gucci 手提包的搜索结果数为 0,因此被移除。
更正拼写错误
  • 更正拼写错误的字词。
  • 在匹配之前,还需清理实时输入查询。
MilcMilk
添加许可名单查询
  • 系统会添加您明确允许的查询。
查看更多信息部分
移除屏蔽名单中的查询
  • 您明确屏蔽的查询会被移除。
查看更多信息部分
移除不安全的字词
  • 使用 Google 安全搜索。
  • 移除不当的查询。
色情、挑逗性、粗俗或暴力内容
移除非常罕见的字词
  • AI 系统会根据查询统计信息调整截止时间。
  • 如果字词非常罕见,则会被移除。
74x39x9 英寸双层双人充气床垫,配有 120V 手持泵。
删除重复字词
  • 基于 AI 驱动的语义理解
  • 对于近乎相同的字词,系统会匹配任一字词,但只会建议更常用的字词。
系统会移除重复的“女鞋”“女士鞋”和“女性鞋”,因此只会建议其中一个。

获取补全建议

使用 completeQuery API 获取建议。 示例:

cURL

curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
"https://retail.googleapis.com/v2/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog:completeQuery?query=sho&dataset=user-data&deviceType=DESKTOP&maxSuggestions=5"

自动补全选项和控件

本部分介绍了可用于自动完成的选项和控件。请参阅下表中的概览和更多详细信息。

控制 详细信息 位置
拒绝名单
  • 手动从建议数据中移除查询。
API 请求:CompletionData:import。 如需了解详情,请参阅导入自动补全数据
列入许可名单
  • 手动向建议数据添加查询。
API 请求:CompletionData:import(另请参阅导入自动补全数据
触发自动补全的最小长度
  • 控制触发自动补全功能所需的字符数。
Google Cloud 控制台 > 控制
匹配顺序
  • 匹配顺序决定了用户查询和建议的匹配方式。
Google Cloud 控制台 > 控制
建议数量
  • 这是自动补全功能将返回的建议数量。
Google Cloud 控制台 > 控制变量
API 请求:completeQuery.maxSuggestions
设备类型
  • 指定设备类型后,系统会根据指定设备类型的受欢迎程度生成建议。
  • 如果不指定此值,系统会根据所有设备类型的综合热度返回建议。
API 请求:completeQuery.deviceType
建议数据源
  • 如果您同时拥有自动生成的数据源和上传的数据源,则可以在查询时选择使用哪个数据源。
API 请求:completeQuery.dataset
语言
  • 您可以指定建议的语言。
API 请求:completeQuery.languageCodes[]

许可名单(请勿移除列表)

Search 会对自动补全建议数据进行后处理,例如拼写更正。您可以创建搜索在后处理时跳过的字词许可名单。

列入许可名单的字词绝不会从建议中过滤掉。许可名单同时适用于上传的数据集自动学习数据集

示例:有一些有意拼错的品牌名称,例如“froot loops”而不是“fruit”或“foot”。请参阅导入补全数据中的详细上传说明。

对于数据导入,您可以使用Google Cloud 控制台 > 控件 > 自动补全控件 > “请勿移除”列表,也可以在 API 中使用 CompletionData:import

更改会在大约 2 天内生效。

拒绝名单

禁止列表仅适用于自动学习数据集。禁止名单不适用于上传的数据集

拒绝名单中的字词绝不会出现在建议中。

如需导入拒绝名单,您可以使用 Google Cloud 控制台 > 控件 > 自动补全控件 > 拒绝名单,也可以使用 API CompletionData:import。如需详细了解如何导入禁止名单,请参阅导入补全数据

更改会在大约 2 天内生效。

触发的最小长度

您可以设置必须至少输入多少字符,自动补全的查询才会返回结果。您可以在 Google Cloud 控制台 > 控件 > 自动补全控件 > 触发自动补全的最小长度中找到此设置。

更改会立即生效。

匹配顺序

这决定了如何将建议与用户输入的内容进行匹配。

如果设置为建议以字词开头,自动补全功能会将用户输入的字词作为建议的精确前缀进行匹配。例如,用户输入“sh”时,系统会匹配建议“shoes”和“shirts”,但不会匹配建议“red shoes”。

如果设置为建议可从字词中的任何位置开始,自动补全功能会将用户输入的字词标记化为多个字词,并将其与建议中的字词进行匹配,而无需考虑字词顺序。例如,用户输入字词“red sh”时,系统会匹配建议“shirts red”“red shoes”和“kid red shoes”。 不过,输入字词“hoes”与这些建议不匹配,因为建议中的任何字词都不是以“hoes”开头的。

您可以在 Google Cloud 控制台 > 控件 > 自动补全控件 > 匹配顺序中找到此设置。

更改会立即生效。

建议数量

这是系统将从自动补全查询中返回的建议数量,不得超过 20。您可以在 Google Cloud 控制台 > 控件 > 自动补全控件 > 建议数量中找到此设置,也可以在 completeQuery 中进行设置。

更改会立即生效。

设备类型

搜索自动补全支持不同的设备类型,例如 mobiledesktop。您可以根据设备类型上传或获取不同的建议。如果未在 completeQuery 中指定 deviceType,则建议将适用于所有设备类型。

对于基于搜索用户事件的自动学习数据集,请在 UserEvent.user_info 中设置 user_agent 以支持不同的设备类型。请参阅 Wiki 中的用户代理

高级功能

本部分介绍了搜索功能提供的高级自动补全功能。例如,您可以利用其他建议(例如品牌和类别)来补充查询自动补全建议。

这些高级功能仅适用于自动学习数据集。

建议 FeatureSet

我们为每个查询建议字词提供了一个额外的 FeatureSet,以便客户在其网站上显示高级功能。

FeatureSet 在响应中显示为键值对映射。 Vertex AI Search for commerce 会在 completeQuery.completionResults.attributes API 响应中返回与每个查询建议相关的最多五个热门类别和品牌。FeatureSet 建议不必与最终用户输入的查询字符串相匹配。

您可以使用响应中的 FeatureSet 来丰富搜索建议。例如:

  • 汇总并创建显示在搜索建议列表下方的热门品牌热门类别部分。
  • 在搜索建议字词旁边显示最受欢迎的品牌或类别。

对目录进行更改(例如更改商品类别)后,预计需要等待 2 周到 30 天,FeatureSet 建议才会反映商品目录更改。之所以需要等待这么长时间,是因为自动学习功能会根据过去 30 天的搜索事件数据进行训练。

属性建议

搜索功能会提供与用户输入字符串匹配的属性建议。支持的属性建议类型包括品牌和类别。

属性建议与建议 FeatureSet 不同。属性建议是建议的商品属性(例如品牌和类别)列表,类似于查询建议是建议的查询列表。属性建议可以独立于查询建议使用。建议 FeatureSet 是查询建议的元数据,因此依赖于查询建议。

属性建议可用于自动补全最终用户正在输入的品牌或类别,并显示在搜索建议列表下方的单独部分中。

包含商品数量的建议分面(实验性)

这是一项实验性功能,仅面向部分客户提供。如需使用此功能,请与支持团队联系。

启用包含商品数量的建议分面功能后,返回的 completeQuery.completionResults 会像往常一样提供自动补全建议列表,但还会提供每条建议的商品数量,包括总数量和按分面(例如 colorcategory)划分的商品数量。

例如,如果搜索查询是“鞋”,则返回的自动补全建议可能是:

  • 女鞋
  • 男鞋

此外,如果感兴趣的商品详情键是 color,系统还会针对每个自动补全建议返回商品数量和按颜色划分的商品数量:

  • 女鞋 (32)
    • 黑色 (10)
    • 灰褐色 (16)
    • 白色 (10)
  • 男鞋 (43)
    • 黑色 (10)
    • 棕色 (5)
    • 绿色 (17)

作为零售商,您无需向买家展示商品数量,但您可以决定根据商品数量(而非 completeQuery.completionResults 中返回的顺序)对建议列表进行排序。 例如,您可能希望鼓励买家查看男士绿色鞋子,因此即使绿色鞋子不是最受欢迎的商品,您也希望它们显示在建议框的顶部。

例如:

{
  "completion_results": [{ 
    "suggestion": "womens shoes"
    "facets": [ 
      {
        "key": "color"
        "values": [ 
          {
            "value": "black"
            "count": 10
          }
          {
            "value": "taupe"
            "count": 16
          }
          {
            "value": "white"
            "count": 10
          }
        ]
      }
    ]
    "total_product_count": 32
  },
  (...)
  ],
}

构面计数信息以 completeQuery.completionResults.facetsFacets 的列表形式显示,对应于每个建议的搜索查询。每个构面都有一个 FacetValues 列表,其中包含每个构面值的商品数量。每个建议的搜索查询的总商品数在 completeQuery.completionResults.totalProductCount 中返回。

如需启用并使用带有商品数量的建议分面,请按以下步骤操作:

  1. 请与支持团队联系,要求他们启用包含商品数量的建议分面功能。指定您要获取哪些 FacetKeys 的商品数量。仅允许 textual_fields 个方面。

  2. 在至少 7 天的时间内,请确保在使用 search API 时,在 FacetSpecs 中添加分面键,并在 search.searchRequest.facetSpecs 中添加分面键。

    之所以需要等待这么长时间,是因为系统会使用过去一周的搜索历史记录数据来计算分面信息。

  3. 为您启用该功能后,completeQuery API 返回的建议将包含按方面和按建议划分的商品数量。

按实体过滤的建议

实体可用于过滤自动补全搜索建议。实体可以是面向不同品牌或区域的网站。您希望自动补全功能能够最准确地反映购买特定品牌或访问特定区域网站的用户的行为。 如需详细了解实体,请参阅实体

请注意,实体过滤只会应用于 completion_results(与 UserEvent 相关)。此过滤条件不会应用于 attribute_results(与 Product 相关)。因此,无论 entity 的值是多少,attribute_results 都是相同的。

如需在自动补全建议中包含实体,请执行以下操作:

  1. 在搜索用户事件 (eventType = "search") 中添加 entity 字段。如需了解相关信息,请参阅搜索用户事件的完整对象示例。

  2. CompleteQuery API 请求中设置 entity 字段,以仅获取该实体的建议。

    用户事件和 API 请求中的实体字符串必须完全一致。否则,自动补全功能会返回空建议。

  3. 确保实体(无论是在搜索用户事件中还是在自动补全请求中)的长度不超过 256 个字符。如果较长,则在处理事件或请求时会被截断为 256 个字符,从而导致不匹配的风险。

通常,实体功能需要 30-90 天的用户事件数据才能返回最佳的自动补全建议。