将数据导出到 BigQuery 中

本页介绍了如何将零售商品和用户事件数据上传到 BigQuery。将数据传输到 BigQuery 后,您需要 使用它通过 Vertex AI 进行销售预测, 以在预构建的 Looker 信息中心内查看数据。

如果您的零售数据已在以下地区的产品和用户事件表中 BigQuery 中的 Vertex AI Search for Retail 格式,您可以跳过此步骤 页面,然后直接前往获取显示关键效果指标的信息中心 指标生成零售销售预测 数据。如需详细了解该格式,请参阅商品架构用户事件简介

准备工作

在将零售数据导出到 BigQuery 之前,您必须完成开始前须知中的步骤。这包括 导入清单信息和用户事件

有关导入的详细信息,请参阅:

在 BigQuery 中创建数据集

您需要在 BigQuery 中创建一个或两个数据集, 产品和用户事件数据您可以使用一个数据集来保存两种类型的数据 也可以创建两个数据集,每种数据类型各一个。

您必须在已实现数据集的同一项目中创建数据集 Vertex AI Search for Retail。

  1. 如果您尚未在 请先启用 BigQuery API,并确保 具有允许您创建数据集和表的 IAM 角色。

    请参阅准备工作使用 IAM 进行访问权限控制

  2. 在 BigQuery 中创建数据集,位于美国(美国 美国)多区域。例如,名称 retail_data。如果您在其他区域创建数据集,则导出 将数据导入到 BigQuery 的操作失败。

    如需了解如何创建数据集,请参阅创建数据集 BigQuery 文档。

    此数据集将用于存储您导出的数据表。通过 以下过程介绍了如何导出。

  3. 可选:若要将用户事件数据放在独立于 请创建第二个数据集。例如,将其命名为 retail_user_event_data

将零售业 Vertex AI Search 目录导出到 BigQuery 表

使用 ExportProducts 方法将零售目录导出到 BigQuery 表。

在使用任何请求数据之前,请先进行以下替换:

  • PROJECT_ID: 您在其中创建了 BigQuery 的 Vertex AI Search for Retail API 项目 数据集。
  • BRANCH_ID:目录的 ID 分支。使用 default_branch 从默认分支获取数据。 如需了解详情,请参阅 目录分支
  • DATASET_ID:您在在 BigQuery 中创建数据集中创建的数据集的名称。例如,使用 retail_dataretail_product_data。数据集必须位于同一项目中。 请勿向此处的 datasetId 字段添加项目 ID。
  • TABLE_ID_PREFIX:前缀 用作表格 ID。此前缀不能为空字符串。后缀为 添加了 retail_products 以补全表名称。例如,如果前缀为 test,则表格名为 test_retail_products

请求 JSON 正文:

{
  "outputConfig":
  {
    "bigqueryDestination":
    {
      "datasetId": "DATASET_ID",
        "tableIdPrefix": "TABLE_ID_PREFIX",
        "tableType": "view"
    }
  }
}

如需发送您的请求,请展开以下选项之一:

您应该收到类似以下内容的 JSON 响应:

{
  "name": "projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/branches/0/operations/17986570020347019923",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ExportProductsResponse",
    "outputResult": {
      "bigqueryResult": [
        {
          "datasetId": "DATASET_ID",
          "tableId": "TABLE_ID_PREFIX_retail_products"
        }
      ]
    }
  }
}

将用户事件导出到 BigQuery 表

使用 userEvents.export 方法将零售用户事件导出到 BigQuery 表:

在使用任何请求数据之前,请先进行以下替换:

  • PROJECT_ID: 您在其中创建了 BigQuery 的 Vertex AI Search for Retail API 项目 数据集。
  • DATASET_ID: 您在创建数据集中创建的数据集 数据。例如,使用 retail_dataretail_product_data
  • TABLE_ID_PREFIX:前缀 。此前缀不能为空字符串。后缀为 添加了 retail_products 以补全表名称。对于 例如,如果前缀为 test,则表为 名为test_retail_products

请求 JSON 正文:

{
  "outputConfig":
  {
    "bigqueryDestination":
    {
      "datasetId": "DATASET_ID",
        "tableIdPrefix": "TABLE_ID_PREFIX",
        "tableType": "view"
    }
  }
}

如需发送您的请求,请展开以下选项之一:

您应该收到类似以下内容的 JSON 响应:

{
  "name": "projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/operations/17203443067109586170",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ExportUserEventsResponse",
    "outputResult": {
      "bigqueryResult": [
        {
          "datasetId": "DATASET_ID",
          "tableId": "TABLE_ID_PREFIX_retail_user_events"
        }
      ]
    }
  }
}

导出的数据简介

对于要导出到的零售数据,您需要注意以下事项 BigQuery 表:

  • 导出到 BigQuery 表中的 项目是已获授权的视图,而非 具体化视图

  • 您无法更改或更新这些表格中的数据。

  • 商品每小时刷新一次。

  • 用户事件会近乎实时刷新。

关于导出的用户事件数据

下面介绍了导出的用户事件数据中包含的产品信息的相关知识。

产品价格信息

userEvents.export 方法返回商品价格信息的方式取决于以下因素:

  • 您在以下日期时,在用户事件数据中添加了价格信息 提取。调用 userEvents.export 时, 方法,随用户事件返回的价格就是采用 事件的时间

  • 您未在用户事件数据中添加价格信息, 销售时,您在商品数据中添加了价格信息 提取。调用 userEvents.export 时, 方法,随用户事件返回的价格不一定是价格 展示商品的价格。这是提取商品数据时在商品数据中找到的价格。

  • 您未在用户事件数据中添加价格信息,并且 商品数据中没有价格信息。当您 调用 userEvents.export 方法时,不会随用户事件返回任何价格。

其他商品信息

在您调用 userEvents.export 方法时,系统会将所有商品信息(价格除外)与用户事件信息联接起来。产品价值从 将用户事件的时间更改为您调用 userEvents.export 的时间。为此 用户事件表中返回的非价格产品值可能是 与用户事件发生时的商品价值不同。

可选:确认新表位于 BigQuery 中

将商品数据和用户事件数据导出到 BigQuery、 确保存在新表。

  1. 在 BigQuery 中,导航到 在 BigQuery 中创建数据集中创建的名称。

  2. 打开数据集并确保看到导出的两个表。 例如,查找名称以 retail_products 结尾的表, retail_user_events