借助适用于 Google Play 的 BigQuery Data Transfer Service,您可以自动安排和管理 Google Play 报告数据的周期性加载作业。
支持的报告
目前,适用于 Google Play 的 BigQuery Data Transfer Service 支持以下每月报告选项:
详细报告
汇总报告
如需详细了解 Google Play 报告如何转换为 BigQuery 表,请参阅 Google Play 报告转换。
报告选项 | 支持 |
---|---|
支持的 API 版本 | 不适用 |
时间表 | 每天在首次创建传输之时(默认值) 您可以配置一天中的具体时间。 |
刷新期 | 过去 7 天 无法配置 |
回填时长上限 | 无限制 虽然 Google Play 没有已知的数据保留限制,但 BigQuery Data Transfer Service 会限制一次回填中可以请求的天数。如需详细了解回填,请参阅设置回填。 |
准备工作
在创建 Google Play 传输之前:
- 验证您是否已完成启用 BigQuery Data Transfer Service 所需的所有操作。
- 创建 BigQuery 数据集,以用于存储 Google Play 数据。
- 找到您的 Cloud Storage 存储分区:
- 在 Google Play 管理中心中,选择任一报告,例如评价。您将在页面底部附近找到您的 Cloud Storage 存储分区对应的 ID。您的存储分区 ID 以
gs://
开头。例如,对于评价报告,您将看到:gs://pubsite_prod_rev_01234567890987654321/reviews
要设置您的转移作业,您只需复制介于gs://
和/reviews
之间的唯一 ID 即可:pubsite_prod_rev_01234567890987654321
- 在 Google Play 管理中心中,选择任一报告,例如评价。您将在页面底部附近找到您的 Cloud Storage 存储分区对应的 ID。您的存储分区 ID 以
- 如果您要设置 Pub/Sub 的转移作业运行通知,必须拥有
pubsub.topics.setIamPolicy
权限。如果您只想设置电子邮件通知,则无需 Pub/Sub 权限。如需了解详情,请参阅 BigQuery Data Transfer Service 运行通知。
所需权限
BigQuery:确保转移作业创建者在 BigQuery 中拥有以下权限:
- 创建转移作业所需的
bigquery.transfers.update
权限 - 针对目标数据集的
bigquery.datasets.get
和bigquery.datasets.update
权限
预定义的 IAM 角色
bigquery.admin
包含bigquery.transfers.update
、bigquery.datasets.update
和bigquery.datasets.get
权限。如需详细了解 BigQuery Data Transfer Service 中的 IAM 角色,请参阅访问权限控制参考文档。- 创建转移作业所需的
Google Play:确保您在 Google Play 中拥有以下权限:
- 您必须在 Google Play 管理中心中拥有报告访问权限。
Google Cloud 团队无法代表您生成或授予对 Google Play 文件的访问权限。请参阅与 Google Play 支持团队联系以获取有关访问 Google Play 文件的帮助。
设置 Google Play 转移作业
设置 Google Play 传输需要提供以下信息:
- Cloud Storage 存储分区。准备工作中介绍了查找 Cloud Storage 存储分区的步骤。您的 Cloud Storage 存储分区以
pubsite_prod_rev
开头。例如:pubsite_prod_rev_01234567890987654321
。 - 表后缀:加载到同一数据集的所有数据源的简单易记的名称。此后缀用于防止不同的转移作业写入相同的表。在将数据加载到同一数据集的所有传输作业中,表后缀必须是唯一的,而且后缀要简短,以尽量缩短所生成的表名称的长度。
要设置 Google Play 转移作业,请按下列步骤操作:
控制台
转到 Cloud Console 中的 BigQuery 页面。
点击转移。
点击创建转移作业。
在创建转移作业页面上:
在来源类型部分的来源中,选择 Google Play。
在转移配置名称部分的显示名中,输入转移作业的名称,例如
My Transfer
。转移作业名称可以是任何容易辨识的值,方便您以后在需要修改该作业时能轻松识别。在时间表选项部分的时间表中,保留默认值(立即开始)或点击在设置的时间开始 (Start at a set time)。
- 在重复频率部分,从以下选项中选择转移作业的运行频率。
- 每日一次(默认值)
- 每周一次
- 每月一次
- 自定义
- 按需
在开始日期和运行时间部分,输入开始转移作业的日期和时间。如果您选择的是立即开始,则此选项会处于停用状态。
- 在重复频率部分,从以下选项中选择转移作业的运行频率。
在目标设置部分的目标数据集中,选择您创建的用来存储数据的数据集。
在数据源详细信息部分,执行以下操作:
- 在 Cloud Storage 存储分区部分,请输入您的 Cloud Storage 存储分区的 ID。
在表后缀 (Table suffix) 部分中,输入后缀,例如“MT”(表示“My Transfer”)。
(可选)在通知选项部分,执行以下操作:
点击保存。
bq
输入 bq mk
命令并提供转移作业创建标志 --transfer_config
。此外,还必须提供以下标志:
--target_dataset
--display_name
--params
--data_source
bq mk \ --transfer_config \ --project_id=project_id \ --target_dataset=dataset \ --display_name=name \ --params='parameters' \ --data_source=data_source
其中:
- project_id 是项目 ID。如果未指定
--project_id
,系统会使用默认项目。 - dataset 是转移作业配置的目标数据集。
- name 是转移作业配置的显示名。转移作业名称可以是任何容易辨识的值,让您以后在需要修改时能够轻松识别。
- parameters 包含所创建转移作业配置的参数(采用 JSON 格式),例如
--params='{"param":"param_value"}'
。对于 Google Play,您必须提供bucket
和table_suffix
参数。bucket
是包含您的 Play 报告文件的 Cloud Storage 存储分区。 - data_source 是数据源,即
play
。
例如,以下命令使用 Cloud Storage 存储分区 pubsite_prod_rev_01234567890987654321
和目标数据集 mydataset
创建名为 My
Transfer
的 Google Play 转移作业。该转移作业将在默认项目中创建:
bq mk \
--transfer_config \
--target_dataset=mydataset \
--display_name='My Transfer' \
--params='{"bucket":"pubsite_prod_rev_01234567890987654321","table_suffix":"MT"}' \
--data_source=play
第一次运行该命令时,您将收到如下消息:
[URL omitted] Please copy and paste the above URL into your web browser and
follow the instructions to retrieve an authentication code.
请按照该消息中的说明操作,并将身份验证代码粘贴到命令行中。
API
使用 projects.locations.transferConfigs.create
方法并提供一个 TransferConfig
资源实例。
Java
排查 Google Play 转移作业设置问题
如果您在设置传输时遇到问题,请参阅排查 BigQuery Data Transfer Service 传输设置问题。
查询数据
当数据转移到 BigQuery 时,数据会写入按提取时间分区的表。如需了解详情,请参阅分区表简介。
如果您要直接查询表,而不是使用自动生成的视图,那么必须在查询中使用 _PARTITIONTIME
伪列。如需了解详情,请参阅查询分区表。
价格
如需了解 Google Play 转移作业价格,请参阅价格页面。
将数据转移到 BigQuery 后,您需要按标准的 BigQuery 存储和查询价格付费。
后续步骤
- 如需查看 Google Play 报告如何转移到 BigQuery,请参阅 Google Play 报告转换。
- 如需大致了解 BigQuery Data Transfer Service,请参阅 BigQuery Data Transfer Service 简介。
- 如需了解如何使用转移作业,包括获取有关转移作业配置的信息、列出转移作业配置以及查看转移作业的运行历史记录,请参阅处理转移作业。