本页面提供了创建目录信息和填充目录数据的最佳做法。
概览
导入到 Vertex AI Search for Retail 的目录数据会直接影响生成的模型的质量,进而影响搜索和推荐结果的质量。通常,您提供的目录信息越准确、具体,您的模型质量就越高。
您的目录应保持最新。您可以根据需要随时上传目录更改;理想情况下,对于变化率较高的目录,每天都应该如此。您可以上传(补丁)现有产品项;系统只会更新更改后的字段。上传目录信息不收取任何费用。如需了解详情,请参阅使目录保持最新状态。
目录分支
如果您使用搜索功能,则可以使用目录分支测试您离线上传的新数据,然后在您的网站上发布。
您最多可以使用三个分支,标识为 0
、1
和 2
。实际网站指向其目录数据的 default_branch
。使用 setDefaultBranch
或 Search for Retail 控制台中的“数据”标签页,指定是您实际 default_branch
的分支(默认设置为分支 0
)。然后,您的网站会使用 default_branch
指向的分支提供的目录数据。
例如,假设 default_branch
设置为分支 ID 0
,因此您的网站正在使用已上传到该分支的目录数据。您可以将新的目录数据上传到分支 1
并进行预览。确认目录已正确上传后,您可以切换到分支 1
作为实际 default_branch
。
在切换分支后,目录缓存最多可能需要 30 分钟才能更新。
如果您使用推荐功能,我们建议您仅使用默认分支,因为分支切换期间会出现更新延迟。如果分支之间的数据差异很大,更新延迟可能会对预测结果产生负面影响。
产品
目录是一系列产品对象的集合。
必需的产品信息
以下字段为必填字段;在目录中创建产品项时,您必须提供这些值。它们还应与您内部产品数据库中使用的值对应,并且应准确反映所表示的产品,因为它们包含在训练模型中。
在某些情况下,还需要填写其他字段。如需查看所有产品字段的完整列表,请参阅 Product
参考页面。
您提供的所有商品信息都可以用来提高推荐内容和搜索结果的质量。请务必提供尽可能多的字段。
字段 | 备注 |
---|---|
name
|
产品的完整、唯一资源名称。除 import 以外的所有 Product 方法都需要此名称。在导入期间,该名称是自动生成的,不需要手动提供。 |
id
|
产品数据库使用的产品 ID。ID 字段在整个目录中必须是唯一的。记录用户事件时,也会使用同一个值,predict 和 search 方法也会返回该值。 |
title
|
产品数据库中的产品标题。UTF-8 编码的字符串。字符数不得超过 1250 个。 |
categories
|
商品类别。每件商品都必须分配到至少一个类别。
如果商品属于多个类别,请针对每个类别重复该字段。
该值必须是编码为 UTF-8 且不为空的字符串,长度不得超过 5,000 个字符。请始终指定完整的类别路径,例如:["Sports & Fitness > Athletic Clothing > Shoes"] 。
|
商品特性
强烈建议您在 Product
中为预定义系统特性提供值,如品牌、颜色和尺寸。您还可以添加使用 Product.attributes
定义的自定义特性。
可检索字段
如果您使用的是搜索,则搜索响应中会包含商品附带的属性(如果您在 Product.retrievableFields
中将这些属性标记为可检索)。然后这些特性可用于其他搜索功能,例如过滤和构面。
可精确搜索的选项
您可以为特定字符串查询提供特定值,以便在可精确搜索的选项(目录属性字段)中使用。如果查询与商品清单中的任何商品匹配,并且该字段的值与查询中给定的字符串相同,则系统会在搜索查询中返回该商品。此选项非常适合序列号,因为客户希望获得有针对性的搜索体验。
ExactSearchableOption
字段通常用于具有确切值(例如 ModelId
或 ManufacturerId
)的商品属性,适用于自定义属性。product_id 等属性是主要索引字段,默认情况下可进行完全匹配搜索。item_id
字段始终处于开启状态(完全匹配),无法停用。
- 为避免在搜索中返回不相关的项,请勿将可搜索的选项设置为通用值(例如
battery
)。 - 为避免无法充分满足搜索查询,请勿将
tag
等特殊字段(其字符串值之一可能是“iphone”)设为可进行完全匹配搜索。否则,这些查询可能会限制商品目录中所有 iPhone 的结果。
如需了解详情,请参阅商品属性简介。
商品级别
商品 SKU 指定决定了目录中的层次结构。
产品指定类型
商品指定类型有三种:
主要商品会在推荐或搜索结果中返回。主项可以是单独的(SKU 级别)项,也可以是一组类似项(SKU 组)。
变体项是 SKU 组主商品的各个版本。变体只能是单独的(SKU 级别)项。例如,如果主商品是“V 领衬衫”,变体可能是“棕色 V 领衬衫,XL 码”和“白色 V 领衬衫,S 码”。主项和变体有时被称为父项和子项。
合集项是主商品或变体商品的套装,例如包含项链、耳环和戒指的珠宝套装。与商品和款式/规格类似的层次结构,合集用于对相关的主要商品进行分组。客户无法直接购买此类商品,它们的使用范围不广,并且仅在搜索网络中提供。
商品示例
例如,根据这些商品指定类型,日杂商品更适合归类为主要商品,每个主要商品都包含一个 SKU 商品,例如 "bananas, fresh"
。
另一方面,最好将 T 恤按层次结构进行设置,将其作为主要商品,并附上相应的一组款式/规格。每个变体代表一个 SKU(每个尺寸一个),每个主要商品代表一组 SKU,其中每个 SKU 都是一个总体 T 恤款式的不同尺寸。这种按 SKU 结构进行分组的组织方式让搜索结果和推荐面板可以显示各种 T 恤款式。这样,买家就可以深入到特定的主商品(款式/颜色)以选择要购买的款式/颜色(尺寸)。
合集用于将客户可能会购买的相关产品分组。为了在重新排名模型中准确表示这些来源,Vertex AI Search 零售解决方案采用了一种逻辑,可将购买交易归因于这些来源。例如:买家点击床单套装中的商品,然后将该合集中的主要商品添加到购物车或购买。该合集会获得相应购买交易的功劳,而该模型会准确反映合集的热门程度和价值。
此外,还有一种仅包含款式/规格的目录类型,但目前已废弃。此目录类型只能与推荐内容搭配使用。对于仅包含变体的目录,ingestionProductType
会在导入期间设为 variant
。系统会根据为每个变体指定的主要商品 ID,推断出每个变体的主商品 ID。
设置商品清单
规划产品目录时,您需要确定目录中包含的商品是仅指定为主项、主项和变体,还是这两种安排的混合。不妨从商品的 SKU 结构的角度来考虑。您的商品可以是主商品,也可能包含或不包含款式/规格。
根据您指定商品 SKU 的方式,考虑设置商品目录的选项:
- 您希望将 SKU 显示为单独的搜索结果或推荐:SKU=primary
- 您的 SKU 应属于一组类似的 SKU:SKU=款式/规格,SKU 组=主 SKU
这两种组合混合使用:SKU=主要,SKU=变体,SKU 组=主要
如果您的商品详情页面显示选项/尺码/颜色选择器,这些选项通常会作为款式/规格上传到您的商品清单中。考虑是否希望具有不同属性(例如尺寸和颜色)的同一商品的不同类型显示为单个搜索结果,还是单独显示。例如,对于某本图书,您需要决定是希望同一图书的精装版 SKU 和平装版 SKU 显示为单独的搜索结果(SKU = 主要),还是显示为一个搜索结果(SKU = 款式/规格,SKU 组 = 主要)。
设置商品目录时,请注意推荐内容和搜索结果只会返回主商品。
最少的主要商品
如果您确定目录中应同时包含主商品和款式/规格(即 SKU 组和 SKU),但目前只有 SKU,则需要为 SKU 组创建主商品。这些主元素有时被称为“虚拟主元素”或“虚假主元素”。
这些主要元素只需包含最少的信息:id
、title
和 categories
。
如果未指定 type
,则商品类型默认为主要商品。如果您要导入,则无需指定 name
。如需了解详情,请参阅上一部分中的必需的产品信息。
类型不可变
您无法更改商品的类型,例如,将变体更改为主商品,或将主商品更改为变体。
如果您确实需要更改商品的类型,请删除该商品,然后使用其他类型重新创建商品。您必须先删除关联的款式/规格,然后才能删除主商品。
目录导入
如果您的目录在 Merchant Center 中,我们建议您通过关联 Merchant Center 账号来导入目录。
如果您的目录不在 Merchant Center 中,而是在 Cloud Storage、BigQuery 或其他存储空间中,请执行批量数据导入。
如果您打算将来从 Merchant Center 导入目录数据,请按照 Merchant Center 导入的说明检查数据,以确保您对目录做出正确的选择。这一点很重要,因为如需更改现有目录的配置,您需要删除该目录并重新上传(请参阅更改商品级别配置)。
如需详细了解如何上传目录,请参阅导入目录信息。
商品目录
商品目录包含:
价格,包括当前价格和原价
库存状况,例如有货、缺货、缺货待补和预订
可售数量
履单信息,例如店内自提、店内取货和次日送达
商品目录分为两级:商品级和本地级。
商品级目录
对于仅在线上销售的零售商,商品目录是在商品一级指定的。为目录中的每件商品设置价格、库存状况和其他商品目录数据。
如需详细了解商品级商品目录(包括如何维护商品目录数据),请参阅更新 Vertex AI Search 零售解决方案的商品目录。
本地商品目录
同时拥有实体店和网店的零售商需要按商店存储商品目录信息。它们使用本地商品目录来实现这一点。
有两个商品字段可用于存储本地商品目录。这两个字段都是包含营业地点(地点 ID)及其相关广告资源信息的列表:
Product.fulfillmentInfo。每个实体店的提货和配送方式
Product.localInventories。每个实体店位置的价格信息、商品属性以及自提和配送方式
您可以使用其中一个或两个字段来提供商店级信息。
如需详细了解本地商品目录,请参阅更新 Vertex AI Search for Retail 的本地商品目录。
目录数据质量指标
Search for Retail 控制台中的数据质量页面会评估您是否需要更新目录数据,以提升搜索结果的质量并解锁搜索效果层级。
下表介绍了 Vertex AI Search for Retail 用于帮助您评估商品数据的质量指标。如需详细了解如何在零售业搜索控制台中查看数据质量指标和搜索效果层级,请参阅解锁搜索效果层级。
目录质量指标 | 质量规则 | 备注 |
---|---|---|
存在 URI 且可访问 | 商品具有有效的 Product.uri 。URI 必须可访问且与您的网域匹配。 |
Google 搜索会使用使用此 URI 抓取的网络信号来提高搜索质量。 |
符合时间一致性 | Product.availableTime 早于当前时间,Product.expireTime 晚于当前时间。 |
只有符合时间一致性的商品可供搜索。 |
存在可搜索特性 | 商品至少有一个设置为可搜索的 attribute 。 |
标记为可搜索的自定义特性可通过文本查询进行搜索。 |
说明存在 | 产品包含非空的 Product.description 。 |
全面的说明有助于提高搜索质量。 |
标题至少包含两个字词 | Product.title 至少包含两个字词。 |
全面的标题有助于提高搜索质量。 |
包含不同的图片 | variant 商品至少有一个 Product.image 。如果您的所有商品均处于 primary 级别,则您可以忽略此指标。 |
该指标仅供参考,不会影响搜索质量。 |
包含不同的价格信息 | variant 商品设置了 Product.priceInfo 。如果您的所有商品均处于 primary 级别,则您可以忽略此指标。 |
该指标仅供参考,不会影响搜索质量。 |
Vertex AI Search for Retail 的产品架构
从 BigQuery 导入目录时,请使用以下 Vertex AI Search for Retail 商品架构创建一个格式正确的 BigQuery 表,并将其与您的目录数据一起加载。然后,导入目录。