Campaign Manager 转移作业
借助适用于 Campaign Manager 的 BigQuery Data Transfer Service 连接器,您可以自动安排和管理 Campaign Manager 报告数据的定期加载作业。
支持的报告
适用于 Campaign Manager(以前称为 DoubleClick Campaign Manager)的 BigQuery Data Transfer Service 支持以下报告选项:
如需了解 Campaign Manager 报告如何转换为 BigQuery 表和视图,请参阅 Campaign Manager 报告转换。
报告选项 | 支持 |
---|---|
重复频率 | 每 8 小时(基于创建时间)。 不可配置 |
刷新时段 | 过去 2 天 不可配置 |
最大回填时长 | 过去 60 天 Campaign Manager 最多可将数据传输文件保留 60 天。超过 60 天的文件会由 Campaign Manager 删除。 |
从 Campaign Manager 转移作业注入数据
当您将数据从 Campaign Manager 转移到 BigQuery 时,数据会加载到按日期分区的 BigQuery 表中。数据加载到的表分区对应于数据源中的日期。如果您在同一日期安排多次转移,BigQuery Data Transfer Service 会使用最新数据覆盖该特定日期的分区。同一天的多个转移作业或正在运行的回填不会导致重复数据,其他日期的分区不受影响。刷新时段
刷新时段是指发生数据转移时数据转移检索数据的天数。例如,如果刷新时段为三天,并且每天进行转移,则 BigQuery Data Transfer Service 会从过去三天内的源表中检索所有数据。在此示例中,当每天进行转移时,BigQuery Data Transfer Service 会使用当前日期的源表数据副本创建新的 BigQuery 目标表分区,然后自动触发回填运行作业,以使用过去两天的源表数据来更新 BigQuery 目标表分区。自动触发的回填运行作业会覆盖或以增量方式更新 BigQuery 目标表,具体取决于 BigQuery Data Transfer Service 连接器是否支持增量更新。
首次运行数据转移作业时,数据转移作业会检索刷新时段内可用的所有源数据。例如,如果刷新时段为三天,并且您首次运行数据转移作业,则 BigQuery Data Transfer Service 会检索三天内的所有源数据。
刷新时段会映射到 TransferConfig.data_refresh_window_days
API 字段。
如需检索刷新时段之外的数据(例如历史数据),或在出现任何转移中断或缺口时恢复数据,您可以启动或安排回填运行作业。
准备工作
在创建 Campaign Manager 数据转移作业之前,请先完成以下操作:
- 确认您已完成启用 BigQuery Data Transfer Service 所需的所有操作。
- 创建 BigQuery 数据集,以用于存储 Campaign Manager 数据。
确保您的组织有权访问 Campaign Manager Data Transfer v2 (Campaign Manager DTv2) 文件。Campaign Manager 团队会将这些文件交付到 Cloud Storage 存储桶。要获得对 Campaign Manager DTv2 文件的访问权限,您需要执行后续步骤,后续步骤取决于您与 Campaign Manager 有无直接的合约关系。无论有无合约关系,您可能都需要支付额外费用。
- 如果您与 Campaign Manager 有合约关系,请联系 Campaign Manager 支持团队,以设置 Campaign Manager DTv2 文件。
- 如果您与 Campaign Manager 没有合约关系,您的代理机构或 Campaign Manager 转销商可能会有 Campaign Manager DTv2 文件的访问权限。请联系您的代理机构或转销商获取这些文件的访问权限。
完成此步骤后,您将收到如下 Cloud Storage 存储分区名称:
dcdt_-dcm_account123456
如果您要设置 Pub/Sub 的转移作业运行通知,必须拥有
pubsub.topics.setIamPolicy
权限。如需了解详情,请参阅 BigQuery Data Transfer Service 运行通知。
所需权限
BigQuery:确保创建数据转移作业的人员在 BigQuery 中拥有以下权限:
- 用于创建数据转移作业的
bigquery.transfers.update
权限 - 针对目标数据集的
bigquery.datasets.get
和bigquery.datasets.update
权限
预定义的 IAM 角色
bigquery.admin
包含bigquery.transfers.update
、bigquery.datasets.update
和bigquery.datasets.get
权限。如需详细了解 BigQuery Data Transfer Service 中的 IAM 角色,请参阅访问权限控制。- 用于创建数据转移作业的
Campaign Manager:对存储在 Cloud Storage 中的 Campaign Manager DTv2 文件的读取权限。访问权限由您从其接收 Cloud Storage 存储桶的实体进行管理。
设置 Campaign Manager 转移作业
设置 Campaign Manager 数据转移作业需要以下内容:
Cloud Storage 存储桶:Campaign Manager DTv2 文件的 Cloud Storage 存储桶 URI(如准备工作中所述)。存储桶名称应类似于:
dcdt_-dcm_account123456
Campaign Manager ID:您的 Campaign Manager 网络、广告客户或 Floodlight ID。网络 ID 在层次结构中为父级。
查找您的 Campaign Manager ID
要检索您的 Campaign Manager ID,您可以使用 Cloud Storage 控制台检查 Campaign Manager Data Transfer Cloud Storage 存储桶中的文件。Campaign Manager ID 可用于在提供的 Cloud Storage 存储桶中匹配文件。该 ID 嵌入在文件名中,而不是 Cloud Storage 存储桶名称中。
例如:
- 在名为
dcm_account123456_activity_*
的文件中,ID 为 123456。 - 在名为
dcm_floodlight7890_activity_*
的文件中,ID 为 7890。 - 在名为
dcm_advertiser567_activity_*
的文件中,ID 为 567。
查找文件名前缀
在极少数情况下,Cloud Storage 存储桶中的文件可能具有自定义的非标准文件名,这些名称是由 Google Marketing Platform 服务团队为您设置的。
例如:
- 在名为
dcm_account123456custom_activity_*
的文件中,前缀为 dcm_account123456custom -_activity
之前的所有内容。
如需帮助,请与 Campaign Manager 支持团队联系。
为 Campaign Manager 创建数据转移作业
控制台
前往 Google Cloud 控制台中的“数据传输”页面。
点击
创建转移作业。在创建转移作业页面上:
在来源类型部分的来源中,选择 Campaign Manager。
在转移配置名称部分的显示名称中,输入数据转移作业的名称,例如
My Transfer
。转移作业名称可以是任何可让您在需要修改转移作业时识别该转移作业的名称。在时间表选项部分的时间表中,保留默认值(立即开始)或点击在设置的时间开始 (Start at a set time)。
- 在重复频率部分,从以下选项中选择转移作业的运行频率。如果您选择除每日一次以外的选项,则系统还会提供其他选项。例如,如果您选择每周一次,则系统会显示一个选项,供您选择星期几。
- 在开始日期和运行时间部分,输入开始数据转移作业的日期和时间。如果选择立即开始,则此选项会处于停用状态。
在目标设置部分的目标数据集中,选择您创建用来存储数据的数据集。
在数据源详细信息部分,执行以下操作:
- 对于 Cloud Storage 存储桶,请输入或浏览存储 Data Transfer V2.0 文件的 Cloud Storage 存储桶的名称。当您输入存储桶名称时,请不要包含
gs://
。 - 在 DoubleClick ID 部分中,输入相应的 Campaign Manager ID。
- (可选)如果文件具有类似于这些示例的标准名称,请将文件名前缀字段留空。如果 Cloud Storage 存储桶中的文件具有自定义文件名,请指定文件名前缀。
- 对于 Cloud Storage 存储桶,请输入或浏览存储 Data Transfer V2.0 文件的 Cloud Storage 存储桶的名称。当您输入存储桶名称时,请不要包含
(可选)在通知选项部分,执行以下操作:
点击保存。
bq
输入 bq mk
命令并提供转移作业创建标志 --transfer_config
。此外,还必须提供以下标志:
--data_source
--target_dataset
--display_name
--params
bq mk --transfer_config \ --project_id=project_id \ --target_dataset=dataset \ --display_name=name \ --params='parameters' \ --data_source=data_source
其中:
- project_id 是项目 ID。
- dataset 是数据转移作业配置的目标数据集。
- name 是数据转移作业配置的显示名称。转移作业名称可以是任何可让您在需要修改转移作业时识别该转移作业的名称。
- parameters 包含所创建数据转移作业配置的参数(采用 JSON 格式),例如
--params='{"param":"param_value"}'
。对于 Campaign Manager,您必须提供bucket
和network_id
参数。bucket
是包含 Campaign Manager DTv2 文件的 Cloud Storage 存储桶。network_id
是您的网络、Floodlight 或广告客户 ID。 - data_source 是数据源 -
dcm_dt
(Campaign Manager)。
您还可以提供 --project_id
标志以指定具体项目。如果未指定 --project_id
,系统会使用默认项目。
例如,以下命令使用 Campaign Manager ID 123456
、Cloud Storage 存储桶 dcdt_-dcm_account123456
和目标数据集 mydataset
创建名为 My Transfer
的 Campaign Manager 数据转移作业。参数 file_name_prefix
为可选参数,仅用于罕见的自定义文件名。
该数据转移作业将在默认项目中创建:
bq mk --transfer_config \
--target_dataset=mydataset \
--display_name='My Transfer' \
--params='{"bucket": "dcdt_-dcm_account123456","network_id": "123456","file_name_prefix":"YYY"}' \
--data_source=dcm_dt
运行命令后,您会收到如下消息:
[URL omitted] Please copy and paste the above URL into your web browser and
follow the instructions to retrieve an authentication code.
请按照说明操作,并将身份验证代码粘贴到命令行中。
API
使用 projects.locations.transferConfigs.create
方法并提供一个 TransferConfig
资源实例。
Java
试用此示例之前,请按照 BigQuery 快速入门:使用客户端库中的 Java 设置说明进行操作。 如需了解详情,请参阅 BigQuery Java API 参考文档。
如需向 BigQuery 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为客户端库设置身份验证。
排查 Campaign Manager 转移作业设置问题
如果您在设置数据转移作业时遇到问题,请参阅排查转移作业配置问题中的 Campaign Manager 转移作业问题。
查询数据
当数据转移到 BigQuery 时,这些数据会写入注入时间分区表。如需了解详情,请参阅分区表简介。
如果您要直接查询表,而不是使用自动生成的视图,则必须在查询中使用 _PARTITIONTIME
伪列。如需了解详情,请参阅查询分区表。
Campaign Manager 示例查询
您可以使用以下 Campaign Manager 查询示例来分析已转移的数据。您还可以在 Looker 数据洞察等可视化工具中使用查询。这些查询旨在帮助您开始使用 BigQuery 来查询 Campaign Manager 数据。如果您对这些报告的功能有其他问题,请联系您的 Campaign Manager 技术代表。
在以下每个查询中,将 dataset 等变量替换为您的值。
最新广告系列
以下 SQL 查询示例会检索最新广告系列。
SELECT Campaign, Campaign_ID FROM `dataset.match_table_campaigns_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE
按广告系列划分的展示次数和不同用户数
以下 SQL 查询示例会分析过去 30 天内按广告系列划分的展示次数和不同用户数。
# START_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) # END_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) SELECT Campaign_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.impression_campaign_manager_id` WHERE _DATA_DATE BETWEEN start_date AND end_date GROUP BY Campaign_ID, Date
按广告系列和日期排序的最新广告系列
以下 SQL 查询示例会分析过去 30 天内按广告系列和日期排序的最新广告系列。
# START_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) # END_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) SELECT Campaign, Campaign_ID, Date FROM ( SELECT Campaign, Campaign_ID FROM `dataset.match_table_campaigns_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE ), ( SELECT date AS Date FROM `bigquery-public-data.utility_us.date_greg` WHERE Date BETWEEN start_date AND end_date ) ORDER BY Campaign_ID, Date
特定日期范围内按广告系列划分的展示次数和不同用户数
以下 SQL 查询示例会按广告系列分析 start_date 和 end_date 之间的展示次数和不同用户数。
# START_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) # END_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) SELECT base.*, imp.count AS imp_count, imp.du AS imp_du FROM ( SELECT * FROM ( SELECT Campaign, Campaign_ID FROM `dataset.match_table_campaigns_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE ), ( SELECT date AS Date FROM `bigquery-public-data.utility_us.date_greg` WHERE Date BETWEEN start_date AND end_date ) ) AS base LEFT JOIN ( SELECT Campaign_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.impression_campaign_manager_id` WHERE _DATA_DATE BETWEEN start_date AND end_date GROUP BY Campaign_ID, Date ) AS imp ON base.Campaign_ID = imp.Campaign_ID AND base.Date = imp.Date WHERE base.Campaign_ID = imp.Campaign_ID AND base.Date = imp.Date ORDER BY base.Campaign_ID, base.Date
按广告系列划分的展示次数、点击次数、活动数和不同用户数
以下 SQL 查询示例会分析过去 30 天内按广告系列划分的展示次数、点击次数、活动数和不同用户数。在此查询中,将 campaign_list 等变量替换为您的值。例如,将 campaign_list 替换为查询范围内所有感兴趣的 Campaign Manager 广告系列的英文逗号分隔列表。
# START_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) # END_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) SELECT base.*, imp.count AS imp_count, imp.du AS imp_du, click.count AS click_count, click.du AS click_du, activity.count AS activity_count, activity.du AS activity_du FROM ( SELECT * FROM ( SELECT Campaign, Campaign_ID FROM `dataset.match_table_campaigns_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE ), ( SELECT date AS Date FROM `bigquery-public-data.utility_us.date_greg` WHERE Date BETWEEN DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) AND DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) ) ) AS base LEFT JOIN ( SELECT Campaign_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.impression_campaign_manager_id` WHERE _DATA_DATE BETWEEN DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) AND DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) GROUP BY Campaign_ID, Date ) AS imp ON base.Campaign_ID = imp.Campaign_ID AND base.Date = imp.Date LEFT JOIN ( SELECT Campaign_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.click_campaign_manager_id` WHERE _DATA_DATE BETWEEN DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) AND DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) GROUP BY Campaign_ID, Date ) AS click ON base.Campaign_ID = click.Campaign_ID AND base.Date = click.Date LEFT JOIN ( SELECT Campaign_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.activity_campaign_manager_id` WHERE _DATA_DATE BETWEEN DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) AND DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) GROUP BY Campaign_ID, Date ) AS activity ON base.Campaign_ID = activity.Campaign_ID AND base.Date = activity.Date WHERE base.Campaign_ID IN campaign_list AND (base.Date = imp.Date OR base.Date = click.Date OR base.Date = activity.Date) ORDER BY base.Campaign_ID, base.Date
广告系列活动
以下 SQL 查询示例会分析过去 30 天的广告系列活动。在此查询中,将 campaign_list 等变量替换为您的值。例如,将 campaign_list 替换为查询范围内所有感兴趣的 Campaign Manager 广告系列的英文逗号分隔列表。
# START_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) # END_DATE = DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) SELECT base.*, activity.count AS activity_count, activity.du AS activity_du FROM ( SELECT * FROM ( SELECT Campaign, Campaign_ID FROM `dataset.match_table_campaigns_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE ), ( SELECT mt_at.Activity_Group, mt_ac.Activity, mt_ac.Activity_Type, mt_ac.Activity_Sub_Type, mt_ac.Activity_ID, mt_ac.Activity_Group_ID FROM `dataset.match_table_activity_cats_campaign_manager_id` AS mt_ac JOIN ( SELECT Activity_Group, Activity_Group_ID FROM `dataset.match_table_activity_types_campaign_manager_id` WHERE _DATA_DATE = _LATEST_DATE ) AS mt_at ON mt_at.Activity_Group_ID = mt_ac.Activity_Group_ID WHERE _DATA_DATE = _LATEST_DATE ), ( SELECT date AS Date FROM `bigquery-public-data.utility_us.date_greg` WHERE Date BETWEEN start_date AND end_date ) ) AS base LEFT JOIN ( SELECT Campaign_ID, Activity_ID, _DATA_DATE AS Date, COUNT(*) AS count, COUNT(DISTINCT User_ID) AS du FROM `dataset.activity_campaign_manager_id` WHERE _DATA_DATE BETWEEN DATE_ADD(CURRENT_DATE(), INTERVAL -31 DAY) AND DATE_ADD(CURRENT_DATE(), INTERVAL -1 DAY) GROUP BY Campaign_ID, Activity_ID, Date ) AS activity ON base.Campaign_ID = activity.Campaign_ID AND base.Activity_ID = activity.Activity_ID AND base.Date = activity.Date WHERE base.Campaign_ID IN campaign_list AND base.Activity_ID = activity.Activity_ID ORDER BY base.Campaign_ID, base.Activity_Group_ID, base.Activity_ID, base.Date