将分析指标导出至 BigQuery

本页面介绍了如何将 Vertex AI Search for Retail 分析指标导出到 BigQuery。通过导出分析指标,您可以保留指标,并编写 SQL 代码来自行分析。

系统会自动为您生成用于零售分析的 Vertex AI Search 指标。 如需详细了解如何使用分析指标衡量 Vertex AI Search for Retail 对业务的影响,请参阅查看分析数据

将指标数据导出到 BigQuery 存在以下限制:

  • 导出到 Vertex AI Search for Retail 项目的 BigQuery 表中的数据是已获授权的视图,而不是具体化视图

  • 您无法更改或更新这些表中的数据。如果您需要更改或更新数据,请将视图导出或复制到另一个目标位置。

  • 您无法导出 180 天前的用户事件指标或生成时间超过 180 天的指标。在 180 天时间段之前生成的任何指标都无法检索。

准备工作

在将指标导出到 BigQuery 之前,您必须完成准备工作中的步骤。这包括导入用户事件和目录信息(可选)。

有关导入的详细信息,请参阅:

在 BigQuery 中创建数据集

您需要在 BigQuery 中创建数据集来保存您的分析指标数据。

您必须在实现了 Vertex AI Search for Retail 的同一项目中创建数据集。

  1. 如果您之前未曾在项目中使用过 BigQuery,请启用 BigQuery API,并确保您拥有用于创建数据集和表的 IAM 角色。

    请参阅准备工作使用 IAM 进行访问权限控制

  2. 美国(美国的多个区域)多区域的 BigQuery 中创建数据集。例如,将其命名为 retail_data。如果您在其他区域中创建数据集,则将数据导出到 BigQuery 会失败。此数据集不支持 CMEK;启用 CMEK 会导致导出失败。

    如需了解如何创建数据集,请参阅 BigQuery 文档中的创建数据集

    此数据集将用于保存您导出的数据表。以下步骤介绍了如何导出。

将分析指标导出到 BigQuery 表

使用 exportAnalyticsMetrics 方法将零售目录导出到 BigQuery 表中。

在使用任何请求数据之前,请先进行以下替换:

  • PROJECT_ID:您在其中创建 BigQuery 数据集的 Vertex AI Search for Retail API 项目的 ID。
  • DATASET_ID:您在 在 BigQuery 中创建数据集步骤中创建的数据集的名称。例如,使用 retail_dataretail_metrics_data
  • TABLE_ID_PREFIX:表 ID 的前缀。此前缀不能为空字符串。系统会添加 retail_analytics_metrics 的后缀以补全表名称。例如,如果前缀为 test,则表名为 test_retail_analytics_metrics

请求 JSON 正文:

{
  "catalog": "projects/PROJECT_ID/locations/global/catalogs/default_catalog",
  "outputConfig":
  {
    "bigqueryDestination":
    {
      "datasetId": "DATASET_ID",
        "tableIdPrefix": "TABLE_ID_PREFIX",
        "tableType": "view"
    }
  }
}

如需发送您的请求,请展开以下选项之一:

您应该收到类似以下内容的 JSON 响应:

{
  "name": "projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/operations/12310973052792775280",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.retail.v2.ExportAnalyticsMetricsResponse",
    "outputResult": {
      "bigqueryResult": [
        {
          "datasetId": "DATASET_ID",
          "tableId": "TABLE_ID_PREFIX_retail_analytics_metrics"
        }
      ]
    }
  }
}

指标定义

导出的指标是计数指标。某些计数指标可能会略有偏移,因为漫游器过滤可能会将某些事件从指标计算中排除。漫游器过滤功能有助于更准确地测量性能。这不会影响 A/B 测试(取决于维度 external_experiment_ids),而漫游器过滤将应用于所有流量。

指标维度

计数指标是直接从具有相同维度的相关用户事件汇总的原始计数。要解读指标,您需要知道指标所依据的维度对于分析指标,搜索和浏览事件称为“展示事件”,detail_page_viewadd_to_cartpurchase 事件称为“转化事件”。下表定义了指标维度。

指标维度 说明
date

生成指标的相关事件的日期。

对于展示指标,这是展示事件的日期。

对于会话和访问者指标,指的是会话/访问者首次展示事件的日期。

external_experiment_ids

生成指标的相关事件的实验 ID。

对于展示指标,这是展示事件的实验 ID。

对于会话和访问者指标,这是会话/访问者内出现的所有展示事件的唯一外部实验 ID 的串联。例如,如果会话/访问者中有两个搜索事件,第一个搜索事件具有 external_experiment_ids“test_arm_1,test_arm_2”,第二个搜索事件具有 external_experiment_ids“test_arm_1,test_arm_3”,则会话/访问者的 external_experiment_id 为“test_arm_1,test_arm_2”和 test_arm_2

device_type

生成指标的相关事件的设备类型,例如,如果事件是通过移动设备或桌面设备生成的。

对于展示指标,这是展示事件的设备类型。

对于会话和访问者指标,如果会话/访问者有多个不同的设备类型,则此字段为空;如果整个会话/访问者只有一种设备类型,则此字段为空。

serving_config

生成指标的相关事件的投放配置。

对于展示指标,这是展示事件的投放配置。

对于会话和访问者指标,如果会话/访问者有多个不同的服务配置,则此字段为空;如果整个会话/访问者只有一个服务配置,则此字段为空。

traffic_destination

生成指标的相关事件的来源。

对于展示次数指标,如果展示是由 Google 投放的,则为“Google”;如果展示是由您自己的解决方案投放的,则为“非 Google”。

对于会话和访问者指标,如果会话/访问者同时由 Google 和您自己的解决方案投放了展示事件,则此值为“混合”。如果展示事件完全由 Google 投放,则为“Google”;如果展示事件仅由您的解决方案针对整个会话/访问者投放,则为“非 Google”。

实体

适用于通过一个商品清单为多个品牌网站或区域提供服务的零售商。实体通常代表品牌或营业地点。

对于展示指标,这是展示事件的实体。

对于会话和访问者指标,此为会话/访问者的展示事件统计前五名的实体。

展示次数指标

系统会根据前提条件计算展示次数指标。转化事件(detail_page_viewadd_to_cartpurchase 事件)只有在满足以下条件时才能归因于展示事件。

  • 展示事件和转化事件的访问者相同。

  • 转化事件的商品 ID 必须出现在展示事件的结果中。

  • 转化事件在展示事件发生后的指定时间范围内。不同类型的转化事件适用不同的转化时间范围。

    转化路径 转化时间范围
    展示 -> 详情页面视图 60 秒
    展示 -> 添加到购物车 24 小时
    展示 -> 购买 48 小时

搜索网络展示次数指标

指标名称 说明
search_event 搜索事件数
detail_page_view_from_search 源自搜索的详情页面浏览事件数
add_to_cart_unit_from_search 搜索结果带来的“添加到购物车”数量
purchase_unit_from_search 搜索到的购买单位数
revenue_from_search 搜索收入
search_event_without_result 未返回任何结果的搜索事件数
search_request_personalization_enabled 启用了个性化功能的搜索请求数量
search_request_personalization_result_served 随个性化结果提供的搜索请求的数量

浏览展示次数指标

指标名称 说明
browse_event 浏览事件数
detail_page_view_from_browse 浏览中的详情页面浏览事件数
add_to_cart_unit_from_browse 浏览期间的“添加到购物车”单元数
purchase_unit_from_browse 浏览期间的购买单元数
revenue_from_browse 浏览带来的收入
browse_event_without_result 未产生结果的浏览事件数
browse_request_personalization_enabled 启用了个性化功能的浏览请求的数量
browse_request_personalization_result_served 随个性化结果提供的浏览请求的数量

会话指标

会话定义为用户与系统之间的持续互动时间段。任何用户事件都会标记会话的开始,如果在接下来的 30 分钟内没有发生任何其他事件,则会标记会话结束。每当启动的会话中发生用户事件时,该会话都会再延长 30 分钟。会话结束后,当用户再次与系统互动时,即开始新会话。

描述会话指标特征的维度由会话中的所有用户事件联合定义。如需了解如何为会话设置维度值,请参阅指标维度

指标名称 说明
session 会话数

搜索会话指标

搜索会话是指至少包含一个搜索事件的会话。请注意,搜索会话也可以是浏览会话指标所定义的浏览会话。

指标名称 说明
search_session 涉及搜索的会话数
search_event_in_search_session 搜索会话内的搜索事件数
browse_event_in_search_session 搜索会话中浏览事件数
detail_page_view_in_search_session 搜索会话内的网页浏览计数
add_to_cart_in_search_session 搜索会话中的“添加到购物车”事件数
add_to_cart_unit_in_search_session 搜索会话中的“添加到购物车”单元计数
purchase_order_in_search_session 搜索会话中的采购订单计数
purchase_unit_in_search_session 搜索会话中的购买单位数
revenue_in_search_session 搜索会话内的收入
bounce_count_in_search_session 在搜索会话中只查看了一个网页就离开网站的访问者的会话数

浏览会话指标

浏览会话是指至少包含一个浏览事件的会话。请注意,浏览会话也可能是由搜索会话指标定义的搜索会话。

指标名称 说明
browse_session 涉及浏览的会话数
search_event_in_browse_session 浏览会话内的搜索事件数
browse_event_in_browse_session 浏览会话中的浏览事件数
detail_page_view_in_browse_session 浏览会话内详情页面浏览量
add_to_cart_in_browse_session 浏览会话中的“添加到购物车”事件数
add_to_cart_unit_in_browse_session 浏览会话中的“添加到购物车”单元计数
purchase_order_in_browse_session 浏览会话中的采购订单计数
purchase_unit_in_browse_session 浏览会话中的购买单元数
revenue_in_browse_session 浏览会话中的收入
bounce_count_in_browse_session 在浏览会话中只查看了一个网页就离开网站的访问者的会话数

访问者指标

访问者通过访问者 ID 进行唯一标识。访问者指标汇总了访问者的所有用户事件信息。

描述访问者指标特征的维度由访问者的所有用户事件联合定义。如需了解如何为访问者设置维度值,请参阅指标维度

指标名称 说明
访问者 访问者数量

搜索访问者指标

搜索访问者是指至少执行了一个搜索事件的访问者。请注意,搜索访问者也可能是由“浏览访问者指标”定义的浏览访问者。

指标名称 说明
search_visitor 至少执行了一次搜索的访问者数量
search_event_from_search_visitor 搜索访问者的搜索事件数
browse_event_from_search_visitor 搜索访问者的浏览事件数
detail_page_view_from_search_visitor 搜索访问者的详情页面浏览量
add_to_cart_from_search_visitor 搜索访问者的“添加到购物车”事件数
add_to_cart_unit_from_search_visitor 搜索访问者的“添加到购物车”单元数
purchase_order_from_search_visitor 搜索访问者的采购订单数量
purchase_unit_from_search_visitor 搜索访问者的购买次数单位
revenue_from_search_visitor 搜索访问者带来的收入

浏览访问者指标

浏览访问者是指至少执行了一个浏览事件的访问者。请注意,浏览访问者也可能是由搜索访问者指标定义的搜索访问者。

指标名称 说明
browse_visitor 至少执行了一次浏览的访问者数量
search_event_from_browse_visitor 浏览访问者的搜索事件数
browse_event_from_browse_visitor 浏览访问者的浏览事件数
detail_page_view_from_browse_visitor 浏览访问者的详情页面浏览量
add_to_cart_from_browse_visitor 浏览访问者的“添加到购物车”事件数
add_to_cart_unit_from_browse_visitor 浏览访问者的“添加到购物车”单元数
purchase_order_from_browse_visitor 浏览访问者的采购订单数
purchase_unit_from_browse_visitor 来自浏览访问者的购买单元数
revenue_from_browse_visitor 浏览者带来的收入

用法示例

如果您将指标数据复制或导出到另一个目标位置,可以使用 SQL 获取有关导出指标的概要或特定信息。以下各部分介绍了使用 SQL 探索导出指标的一些常见方法。

计算点击率 (CTR)

按日期、设备类型和流量目的地计算搜索点击率。

SELECT
  `date`,
  device_type,
  traffic_destination,
  SUM(detail_page_view_from_search) / SUM(search_event) as search_CTR
FROM copied_table
GROUP BY `date`, device_type, traffic_destination

获取由浏览带来的详情页面浏览量

使用包含 test_armexternal_experiment_ids 获取 Google 流量浏览事件带来的详情页面浏览事件,并显示所有维度信息。external_experiment_ids 重复 string

SELECT
  `date`,
  external_experiment_ids,
  device_type,
  serving_config,
  traffic_destination,
  entity,
  detail_page_view_from_browse
FROM copied_table
WHERE
  traffic_destination = 'Google' AND 'test_arm' in UNNEST(external_experiment_ids)

获取最常用的服务配置

获取 Google 流量在“2023 年 10 月 1 日”到“2023 年 11 月 1 日”期间最常用的服务配置。每个搜索事件都应具有关联的服务配置。

SELECT
  serving_config,
  SUM(search_event) as total_search_count
FROM copied_table
WHERE `date` between '2023-10-01' and '2023-11-01' AND traffic_destination = 'Google'
GROUP BY serving_config
ORDER BY total_search_count