数据质量

本页介绍了搜索用例及其各自的效果层级,以及如何查看 Retail Search 控制台以评估数据质量以及您已解锁哪些效果层级。当您满足每个效果层级的所有升级阻止数据要求后,系统会自动启用相应层级。此外,您还必须满足所有之前层级的要求,才能升级到下一层级。

搜索用例

搜索功能可针对以下两种使用情形提供搜索结果:

  • 文本查询搜索:当购物者通过输入文本查询并获取一组相关结果来查找应用中的商品时,系统会使用此功能。
  • 浏览搜索:当买家进入特定类别页面(例如家居装修商店零售网站的“家电”类别网页)并浏览该类别中已排序的商品时,系统会使用此维度。

如需详细了解这两种用例之间的区别,请参阅文本搜索和浏览搜索简介

解锁搜索广告效果层级

文本查询搜索和浏览搜索具有不同的效果层级,可不断改进您的搜索结果。要解锁效果层级,您需要上传到 Vertex AI Search for Retail 的用户事件和目录数据。

以下性能层级适用于文本查询搜索和浏览这两种用例:

第 1 层级

相关性

  • 系统会根据与查询的相关程度返回结果,例如,在查询黑色连衣裙时,系统会返回连衣裙的黑度

最低数据量要求

  • 目录
  • 查询

第 2 层级

相关性和热门程度

  • 针对所查询搜索中最热门的商品优化第 1 层级。
  • 在相关性方面不相上下的商品会按其在您网站上的受欢迎程度进行排名。

最低数据量要求:点击数据

第 3 层级

以提高收入为目标的排名:系统会根据特定的网站活动,按商品被购买的可能性对相关结果进行排名。

最低数据要求:大量用户事件。

第 4 层级

个性化收入优化型排名

  • 系统会根据具体用户的偏好以及商品被购买的可能性(基于该用户在整个网站上的活动)对相关结果进行排名。
  • 商品的排名取决于与搜索或浏览网站的唯一用户的“匹配质量”。

最低数据量要求

  • 大量用户事件。
  • visitorID 和/或 userId 匹配,在所有用户事件中采用一致的格式。

浏览

青铜级

随机结果

  • 符合您的过滤条件的所有搜索结果(随机顺序)。

白银级

热门程度

  • 系统仅根据与类别的相关性来返回结果。

GOLD

以提高收入为目标的排名

  • 系统会根据网站上的活动,按商品的购买可能性对相关结果进行排名。

白金

个性化收入优化型排名

  • 系统会根据各个用户的偏好以及商品的购买可能性(基于网站范围内的活动)对相关结果进行排名。

Search for Retail 控制台中提供了数据质量页面,您可以在其中检查自己是否符合各个层级的数据要求。

以下部分介绍了如何注册数据质量提醒,以便系统根据您当前的参数通知您数据属于哪个层级。这些提醒还可作为特定使用情形数据要求的指南,帮助您最大限度地优化搜索结果。

检查数据质量

上传数据后,请前往 Retail Search 控制台,查看应用场景的每个性能层级的数据检查指标。

  1. 前往 Search for Retail 控制台中的数据质量页面。

    前往“数据质量”页面

  2. 查看搜索用例的数据检查指标:

    • 如需查看文本搜索指标,请点击搜索标签页。
    • 如需查看浏览搜索指标,请点击浏览标签页。
  3. 查看页面顶部各个效果层级的问题计分卡。

    • 如果标记为“正在使用”:您已满足该层级的所有屏蔽问题,并已解锁该层级。
    • 如果没有屏蔽问题:您已满足相应层级的数据检查要求。如果此层级和所有之前的层级都没有阻止问题,则大约需要 24 小时才能训练和准备模型,并激活新解锁的层级。
    • 如果存在任何阻止问题:请查看相应层级的指标,了解需要解决哪些数据问题才能解锁该层级。
  4. 查看每个性能层级的数据检查指标表,查看可能会阻止层级升级或影响搜索广告效果的问题列表。

  5. 查看状态列,了解每个数据检查指标的优先级:

    • 升级阻塞:可识别出导致搜索无法将您的应用场景升级到下一性能层级的数据问题。如需解锁某个层级,需要通过相应性能层级(及其先前层级)的所有阻止升级的数据检查。
    • 对效果至关重要:可识别出不会阻止升级但可能会对文本搜索或浏览搜索效果产生重大影响的数据问题。
    • 合规:表示已成功通过此数据检查。
    • 不可用:表示尚未完成非升级屏蔽数据检查。这些指标的值会显示为 N/A。导入数据后,最多可能需要 24 小时才能执行一些数据检查。
  6. 如需详细了解任何指标,请点击详细信息,以查看详细信息面板,其中会显示该指标的说明、数据检查时间戳和阈值。

  7. 在指标的详细信息面板中查看阈值,了解满足该指标的数据检查要求并改进结果所需的值。并非所有阈值都适用于所有指标:

    • 屏蔽阈值:必须达到的阈值,才能满足此指标的数据检查要求。
    • 临界阈值:强烈建议达到的阈值。 如果不满足此阈值,可能会对性能产生严重的负面影响。
    • 警告阈值:建议达到的阈值。如果未达到此阈值,可能会对性能产生轻微影响。

如需导入更多数据以解决任何数据问题,请参阅公开文档中的导入历史用户事件导入目录信息

最佳做法

  • 在搜索请求和用户事件中,除了为已登录用户提供访问者 ID 外,还应提供用户 ID。这样一来,搜索功能便可根据用户在不同设备上的已登录事件为用户提供个性化搜索结果。
  • 实时发送用户事件,而不是延迟批量上传。这有助于搜索功能根据用户在您网站上的最新活动进行个性化设置。
  • 上传所有用户事件。例如,请勿仅提交可归因于搜索的事件。

针对收入优化层级的上层选择特征

Vertex AI Search 零售解决方案已针对数据达到较高效果层级的零售商进行了升级,可解锁可优化收入的搜索功能。以下上层级别的零售商现在可以使用功能选择功能:

  • 对于浏览:白银级和黄金级
  • 对于搜索广告系列:第 3 层级和第 4 层级

为何要升级排名?

面向大型零售客户的 Vertex AI Search 可在商品清单中包含多达 10,000 个自定义属性,而排名模型之前只有 20 个静态商品特征(例如价格和平均评分),这些特征供所有客户共享。这导致排名模型中的产品数据非常不完整,无法根据不同的零售领域和使用情形(例如时尚、硬件或家居用品)对产品特性进行自定义。

由于无法对自定义属性进行建模,一些用户将他们认为重要的属性添加到了静态(固定)商品特征中。不过,这需要手动操作,而且显然只适用于少数属性。

动态自定义特征选择

Vertex AI Search 零售解决方案已升级其以提高收入为目标的层级,以自动选择自定义属性。此次升级涉及将相关自定义属性纳入排名流程:

  • 会遍历每个零售商的所有自定义属性,并选择最实用的属性添加到静态商品特性集。
  • 显示每个零售商的所选属性。
  • 定期(每 30 天一次)重复执行特征选择流程。

总而言之,Vertex AI Search for Retail 不仅可让排名模型访问多达 100 次或更多潜在的新特征,以供模型选择,还会定期刷新每个客户的属性,以适应季节性销售和其他动态数据变化。

经过升级的排名解决方案利用定期刷新的自定义属性来提升数据质量,从而提供更强大的搜索数据分析。

全面的产品知识

  • 特征选择:Vertex AI Search for Retail 算法最多会为每个零售商选择 20 项最重要的自定义属性。
  • 优势:利用商品的其他信息(例如促销代码和商品或款式规格)提高排名准确性。
  • 公开范围:零售商可以查看所选的自定义属性,并确保这些属性得到维护和及时更新。
  • 自定义和学习:客户可以识别所选自定义属性中的模式,并添加其他相关属性,以进一步提升排名效果。

如何查看正在使用的属性

如果客户启用了更高级别的服务,并且拥有足够的用户事件数据点,则现在可以在控制台中看到新的自定义属性信息,这些信息会显示在面向零售的搜索的数据质量页面中的文字搜索和/或浏览搜索标签页下。此处会显示 Vertex AI Search for Retail 系统选择的自定义属性。

替代文本

如何处理自定义属性

  • 维护所选属性,不要删除或废弃这些属性,因为这可能会影响模型。
  • 为更多商品填充这些字段,提高自动选择的属性的覆盖率
  • 检查系统自动选择自定义属性的趋势。如果您有其他类似的属性,请将其添加到目录中。这些内容将成为特征搜索算法选择的候选内容。
  • 为数字属性分配数字值(而非字符串值),以正确注释数字属性。例如,提供数值 10.5,而不是文本(“10.5”)。

关闭个性化功能

如要关闭个性化设置,请将 ServingConfig.personalizationSpec 设置为 mode.DISABLED

数据质量提醒

如果信息中心上某个指标的值从“满足”更改为“不满足”,系统就会触发数据质量提醒。系统会通过电子邮件发送提醒。

如果您想查看 Cloud Monitoring 相关提醒,请参阅设置提醒

查看数据质量

  1. 前往 Search for Retail 控制台中的数据质量页面。

    前往“数据质量”页面

  2. 查看行、指标和提醒:一行对应一个指标,一个指标对应一个提醒。

设置数据质量提醒

REST

调用 UpdateAlertConfig API。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "ENROLLED",
      "recipients": [
        {
          "emailAddress": "EMAIL_ADDRESS_1"
        },
        {
          "emailAddress": "EMAIL_ADDRESS_2"
        }
      ]
    }
  ]
}'

替换以下内容:

  • PROJECT_ID:您的 Google Cloud 项目的 ID。
  • EMAIL_ADDRESS_1EMAIL_ADDRESS_2:您要注册接收提醒的电子邮件地址。它们应符合 SMTP 标准。一个提醒政策最多可以添加 20 个电子邮件地址。

控制台

  1. 前往 Search for Retail 控制台中的数据质量页面。

    前往“数据质量”页面

  2. 点击顶部的 配置提醒

  3. 请至少添加一个电子邮件地址。电子邮件地址应符合 SMTP(简单邮件传输协议)规范。您最多只能向一个提醒政策添加 20 个电子邮件地址。

  4. 点击提交

停用数据质量提醒

REST

调用 UpdateAlertConfig API。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "DECLINED",
      "recipients": [
      ]
    }
  ]
}'

替换以下内容:

  • PROJECT_ID:您的 Google Cloud 项目的 ID。

控制台

  1. 前往 Search for Retail 控制台中的数据质量页面。

    前往“数据质量”页面

  2. 点击 Configure alerts(配置提醒)。

  3. 删除所有现有电子邮件。

  4. 点击提交

问题排查

下面介绍了如何解决以下常见问题。

数据检查未通过

如果某项数据检查未通过,请在数据质量页面上点击相应指标的详细信息,查看该指标的更详细说明以及满足该数据检查所需达到的阈值。

如果您已满足数据要求,请查看时间戳部分,了解该指标上次计算的时间。如果您最近重新格式化了大量数据或提取了大量数据,则系统可能需要数小时才能重新计算该指标。

如果您不符合数据要求,则可能需要重新设置数据格式或收集更多数据,以满足数据检查要求。确保数据符合指标阈值后,请重新导入重新格式化的数据或导入其他数据,然后等待系统重新计算指标。

标记为“不适用”的指标值

如果尚未上传任何数据或尚未计算指标,指标值会显示为“无”。导入数据后,最多可能需要 24 小时才能执行一些数据检查。

效果层级没有屏蔽问题,但未在使用

如需进行问题排查,请按以下步骤操作:

  1. 检查之前层级是否存在任何阻塞数据问题。您需要满足所有先前层级的要求,才能升级到下一层级。

  2. 等待 24 小时。通过所有阻止升级的数据检查后,系统需要大约 24 小时才能训练和准备模型,并激活新解锁的层级。

如果在通过所有升级阻止数据检查后的两天内,该效果层级未被标记为“正在使用”,请与 Vertex AI Search for Retail 支持团队联系,并提供您的项目编号和项目 ID 以寻求帮助。

其他数据要求信息

如需详细了解 Vertex AI Search 零售解决方案的数据要求,请参阅以下文档:

后续步骤