在 BigQuery 中配置和使用实体解析
本文档介绍如何为实体解析最终用户(以下称为“最终用户”)和身份提供方实现实体解析。
最终用户可以使用此文档与身份提供方连接,并使用提供方的服务来匹配记录。身份提供方可以使用本文档设置和配置服务,以在 Google Cloud Marketplace 上分享给最终用户。
最终用户的工作流
以下部分向最终用户介绍如何在 BigQuery 中配置实体解析。如需查看完整设置的直观呈现,请参阅实体解析架构。
准备工作
- 与身份提供方联系并建立关系。BigQuery 使用 LiveRamp 支持实体解析。
- 从身份提供方获取以下各项:
- 服务账号凭据
- 远程函数签名
- 在您的项目中创建两个数据集:
- 输入数据集
- 输出数据集
所需的角色
如需获得运行实体解析作业所需的权限,请让您的管理员为您授予以下 IAM 角色:
-
允许身份提供方的服务账号读取输入数据集和写入输出数据集:
-
输入数据集的 BigQuery Data Viewer (
roles/bigquery.dataViewer
) 角色 -
输出数据集的 BigQuery Data Editor (
roles/bigquery.dataEditor
) 角色
-
输入数据集的 BigQuery Data Viewer (
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
转换或解析实体
如需了解具体的身份提供方说明,请参阅以下部分。
LiveRamp
前提条件
- 在 BigQuery 中配置 LiveRamp 嵌入式身份。如需了解详情,请参阅在 BigQuery 中启用 LiveRamp 嵌入式身份。
- 与 LiveRamp 协调,启用用于嵌入式身份的 API 凭据。如需了解详情,请参阅身份验证。
设置
首次使用 LiveRamp 嵌入式身份时,必须执行以下步骤。设置完成后,在各次运行之间只需修改输入表和元数据表。
创建输入表
在输入数据集中创建一个表。在该表中填充 RampID、目标网域和目标类型。如需了解详情和示例,请参阅输入表列和说明。
创建元数据表
元数据表用于控制 LiveRamp 嵌入式身份在 BigQuery 上的执行。在输入数据集中创建一个元数据表。在该表中填充客户端 ID、执行模式、目标网域和目标类型。如需了解详情和示例,请参阅元数据表列和说明。
向 LiveRamp 共享表
向 LiveRamp Google Cloud 服务账号授予查看和处理输入数据集中数据的权限。如需了解详情和示例,请参阅向 LiveRamp 共享表和数据集。
运行嵌入式身份作业
如需在 BigQuery 中使用 LiveRamp 运行嵌入式身份作业,请执行以下操作:
- 确认在您的网域中编码的所有 RampID 都包含在输入表中。
- 在运行作业之前,确认元数据表仍然准确。
- 使用作业进程请求联系 LiveRampIdentitySupport@liveramp.com。添加输入表、元数据表和输出数据集的项目 ID、数据集 ID 和表 ID(如果适用)。如需了解详情,请参阅通知 LiveRamp 启动转码。
结果通常会在 3 个工作日内提交到输出数据集。
LiveRamp 支持
如有支持问题,请与 LiveRamp 身份支持联系。
LiveRamp 结算
LiveRamp 会处理实体解析的结算。
身份提供方的工作流
以下部分向身份提供方介绍如何在 BigQuery 中配置实体解析。如需查看完整设置的直观呈现,请参阅实体解析架构。
准备工作
- 创建 Cloud Run 作业或 Cloud Run 函数以与远程函数集成。这两个选项都适合此用途。
记下与 Cloud Run 或 Cloud Run 函数关联的服务账号的名称:
在 Google Cloud 控制台中,转到 Cloud Functions 页面。
点击函数的名称,然后点击详情标签页。
在常规信息窗格中,找到并记下远程函数的服务账号名称。
创建远程函数。
从最终用户处获取最终用户主账号。
所需的角色
如需获得运行实体解析作业所需的权限,请让您的管理员为您授予以下 IAM 角色:
-
允许与您的函数关联的服务账号读取和写入关联的数据集和启动作业:
-
项目的 BigQuery Data Editor (
roles/bigquery.dataEditor
) 角色 -
项目的 BigQuery Job User (
roles/bigquery.jobUser
)
-
项目的 BigQuery Data Editor (
-
允许最终用户主账号查看和连接到远程函数:
-
连接的 BigQuery Connection User (
roles/bigquery.connectionUser
) -
包含远程函数的控制平面数据集的 BigQuery Data Viewer (
roles/bigquery.dataViewer
)
-
连接的 BigQuery Connection User (
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
共享实体解析远程函数
修改以下远程接口代码并分享给最终用户。最终用户需要此代码来启动实体解析作业。
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
将 LIST_OF_PARAMETERS 替换为传递给远程函数的参数列表。
可选:提供作业元数据
您可以视情况提供作业元数据,可以使用单独的远程函数,也可以在用户的输出数据集中写入新的状态表。元数据的示例包括作业状态和指标。
身份提供方的结算
为了简化客户结算和新手引导,我们建议您将实体解析服务与 Google Cloud Marketplace 集成。这样,您就可以根据实体解析作业用量设置价格模式,并由 Google 为您处理结算。如需了解详情,请参阅提供软件即服务 (SaaS) 产品。