如果您想要创建新模型或推荐,则该模型需要用户事件数据进行训练。训练所需的数据量取决于推荐类型和优化目标。请参阅用户事件数据要求。
设置实时事件记录后,可能需要相当长的时间记录足够的用户事件数据来训练模型。您可以通过从过去的事件中批量导入用户事件数据来加速初始模型训练。在此之前,请查看记录用户事件的最佳做法。
您可以:
- 从 Cloud Storage 导入事件。
- 使用
userEvents.import
方法以内嵌方式导入事件。 - 从 BigQuery 导入事件。
- 从 BigQuery 导入 Google Analytics 360 事件。
从 Cloud Storage 导入用户事件
如需从 Cloud Storage 导入用户事件,请创建一个包含 JSON 数据的文件。
确保您的 JSON 文件如下:
- 格式根据用户事件类型设置。有关每种用户事件类型格式的示例,请参阅用户事件。
- 在一行上提供整个用户事件,不带换行符。
- 将每个用户事件放在单独的一行上。
以内嵌方式导入用户事件
curl
您可以通过在 userEvents.import
方法的调用中包含事件的数据来以内嵌方式导入用户事件。
最简单的方法是将用户事件数据放入 JSON 文件并将该文件提供给 cURL。
如需了解用户事件类型的格式,请参阅用户事件。
创建 JSON 文件:
{ "inputConfig": { "userEventInlineSource": { "userEvents": [ { <userEvent1>> }, { <userEvent2> }, .... ] } } }
调用 POST 方法:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @./data.json \ "https://retail.googleapis.com/v2/projects/PROJECT_ID/locations/global/catalogs/default_catalog/userEvents:import"
从 BigQuery 导入用户事件
使用 userEvents.import
方法从 BigQuery 导入用户事件。
您的用户事件必须在适合 Recommendations AI 提取的正确格式的 BigQuery 表中。表架构因用户事件类型而异。如需了解为每种事件类型创建 BigQuery 表时要指定的 JSON 架构,请参阅用户事件类型和示例架构。
导入事件时,请使用 dataSchema
的 user_event
值。
export GOOGLE_APPLICATION_CREDENTIALS=/tmp/my-key.json
curl \
-v \
-X POST \
-H "Content-Type: application/json; charset=utf-8" \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token)"" \
"https://retail.googleapis.com/v2/projects/PROJECT_ID/locations/global/catalogs/default_catalog/userEvents:import" \
--data '{
"inputConfig": {
"bigQuerySource": {
"datasetId": "DATASET-ID",
"tableId": "TABLE-ID",
"dataSchema": "user_event"
}
}
}'
如果您的 BigQuery 数据集属于与 Recommendations AI 项目不同的项目,请按照设置对 BigQuery 数据集的访问权限中的说明,为您的 Recommendations AI 服务帐号授予 BigQuery 项目的 BigQuery Data Editor 角色。修改导入请求以指定 BigQuery 项目 ID:
"bigQuerySource": {
"projectId": "BQ_PROJECT_ID",
}
使用 BigQuery 导入 Google Analytics 360 用户事件
如果您已将 Google Analytics 360 与 BigQuery 集成并使用增强型电子商务功能,则可以导入 Google Analytics 360 用户事件。
以下过程假设您熟悉 BigQuery 和 Google Analytics 360 的使用。
准备工作
在开始后续步骤之前,请确保:
- 您使用的是增强型电子商务。
- 您已将 BigQuery 关联到 Analytics 360。
查看数据源
确保您要导入的用户事件数据在您有权访问的 BigQuery 表中已正确设置了格式。
该表的格式应为
project_id:ga360_export_dataset.ga_sessions_YYYYMMDD
。请参阅 Google Analytics(分析)文档,详细了解该表的格式。
在 BigQuery Google Cloud Console 中,从资源中选择该表以预览该表,然后检查:
clientId
列具有有效值(例如123456789.123456789
)。请注意,该值与完整的 _ga Cookie 值(格式类似于
GA1.3.123456789.123456789
)不同。hits.transaction.currencyCode
列具有有效的货币代码。
检查上传的目录与 Analytics 360 用户事件表之间的项 ID 一致性。
使用 BigQuery 表预览的
hits.product.productSKU
列中的任意产品 ID 和product.get
方法,确保您上传的目录中有相同的产品。export GOOGLE_APPLICATION_CREDENTIALS=/tmp/my-key.json curl \ -v \ -X GET \ -H "Content-Type: application/json; charset=utf-8" \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token)"" \ "https://retail.googleapis.com/v2/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/branches/default_branch/products/PRODUCT_ID"
导入 Google Analytics 360 事件
通过在调用 userEvents.import
方法时添加事件数据,导入用户事件。
对于 dataSchema
,请使用值 user_event_ga360
。
export GOOGLE_APPLICATION_CREDENTIALS=/tmp/my-key.json
curl \
-v \
-X POST \
-H "Content-Type: application/json; charset=utf-8" \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token)"" \
"https://retail.googleapis.com/v2/projects/PROJECT_ID/locations/global/catalogs/default_catalog/userEvents:import" \
--data '{
"inputConfig": {
"bigQuerySource": {
"datasetId": "some_ga360_export_dataset",
"tableId": "ga_sessions_YYYYMMDD",
"dataSchema": "user_event_ga360"
}
}
}'
如果您的 BigQuery 数据集属于与 Recommendations AI 项目不同的项目,请按照设置对 BigQuery 数据集的访问权限中的说明,为您的 Recommendations AI 服务帐号授予 BigQuery 项目的 BigQuery Data Editor 角色。修改导入请求以指定 BigQuery 项目 ID:
"bigQuerySource": {
"projectId": "GA360_BQ_PROJECT_ID",
}