在 BigQuery 中設定及使用實體解析功能
本文說明如何為實體解析度使用者 (以下簡稱「使用者」) 和身分識別提供者實作實體解析度。
使用者可以參考這份文件,連線至身分識別提供者,並使用提供者的服務比對記錄。身分識別供應商可參考這份文件,設定及配置服務,以便在 Google Cloud Marketplace 上與使用者共用。
使用者的工作流程
以下各節將說明如何讓使用者在 BigQuery 中設定實體解析。如要查看完整設定的視覺化呈現方式,請參閱實體解析架構。
事前準備
- 與身分提供者聯絡並建立關係。 BigQuery 支援使用 LiveRamp 進行實體解析。
- 向身分識別提供者取得下列項目:
- 服務帳戶憑證
- 遠端函式簽章
- 在專案中建立兩個資料集:
- 輸入資料集
- 輸出資料集
必要的角色
如要取得執行實體解析作業所需的權限,請要求管理員授予下列 IAM 角色:
-
如要讓身分識別提供者的服務帳戶讀取輸入資料集並寫入輸出資料集:
-
輸入資料集的 BigQuery 資料檢視者 (
roles/bigquery.dataViewer
) -
BigQuery 資料編輯者 (
roles/bigquery.dataEditor
) 輸出資料集
-
輸入資料集的 BigQuery 資料檢視者 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
翻譯或解析實體
如需特定身分識別提供者操作說明,請參閱下列章節。
LiveRamp
必要條件
- 在 BigQuery 中設定 LiveRamp 內嵌 ID。詳情請參閱在 BigQuery 中啟用 LiveRamp 內嵌式 ID。
- 與 LiveRamp 協調,啟用 API 憑證以搭配 Embedded Identity 使用。詳情請參閱「驗證」。
設定
首次使用 LiveRamp Embedded Identity 時,請務必執行下列步驟。設定完成後,每次執行時只需要修改輸入資料表和中繼資料表。
建立輸入表格
在輸入資料集中建立資料表。在表格中填入 RampID、目標網域和目標類型。如需詳細資料和範例,請參閱「輸入資料表資料欄和說明」。
建立中繼資料表
中繼資料表用於控管在 BigQuery 上執行的 LiveRamp 嵌入式 ID。在輸入資料集中建立中繼資料表。 在資料表填入用戶端 ID、執行模式、目標網域和目標類型。如需詳細資料和範例,請參閱「中繼資料表資料欄和說明」。
與 LiveRamp 分享資料表
授予 LiveRamp Google Cloud 服務帳戶權限,以便查看及處理輸入資料集中的資料。如需詳細資訊和範例,請參閱「與 LiveRamp 共用資料表和資料集」。
執行內嵌身分工作
如要在 BigQuery 中使用 LiveRamp 執行嵌入式 ID 工作,請按照下列步驟操作:
- 確認網域中編碼的所有 RampID 都位於輸入表格中。
- 執行工作前,請確認中繼資料表是否仍正確無誤。
- 如要提出工作程序要求,請傳送電子郵件至 LiveRampIdentitySupport@liveramp.com。請一併提供輸入資料表、中繼資料表和輸出資料集的專案 ID、資料集 ID 和資料表 ID (如適用)。詳情請參閱「通知 LiveRamp 啟動轉碼」。
結果通常會在三個工作天內傳送到輸出資料集。
LiveRamp 支援
如有支援問題,請與 LiveRamp Identity 支援團隊聯絡。
LiveRamp 帳單
LiveRamp 會處理實體解析的帳單。
識別資訊提供者工作流程
以下各節說明身分識別提供者如何在 BigQuery 中設定實體解析。如要查看完整設定的視覺化呈現方式,請參閱實體解析架構。
事前準備
- 建立 Cloud Run 工作或 Cloud Run 函式,與遠端函式整合。這兩種方式都適合用於此目的。
記下與 Cloud Run 或 Cloud Run 函式相關聯的服務帳戶名稱:
前往 Google Cloud 控制台的「Cloud Functions」頁面。
按一下函式名稱,然後點選「詳細資料」分頁標籤。
在「General Information」(一般資訊) 窗格中,找到並記下遠端函式的服務帳戶名稱。
建立遠端函式。
向使用者收集使用者主體。
必要的角色
如要取得執行實體解析作業所需的權限,請要求管理員授予下列 IAM 角色:
-
如要讓與函式相關聯的服務帳戶讀取及寫入相關聯的資料集,並啟動作業:
-
專案的「BigQuery 資料編輯者」 (
roles/bigquery.dataEditor
) -
專案的 BigQuery 工作使用者 (
roles/bigquery.jobUser
)
-
專案的「BigQuery 資料編輯者」 (
-
如要讓使用者主體查看及連線至遠端函式:
-
BigQuery Connection 使用者 (
roles/bigquery.connectionUser
) 連線 -
BigQuery 資料檢視者 (
roles/bigquery.dataViewer
) 在控制層資料集上使用遠端函式
-
BigQuery Connection 使用者 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
共用實體解析遠端函式
修改下列遠端介面程式碼,並分享給一般使用者。使用者需要這個程式碼才能啟動實體解析工作。
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
將 LIST_OF_PARAMETERS 替換為傳遞至遠端函式的參數清單。
選用:提供工作的中繼資料
您可以選擇使用個別的遠端函式提供工作的中繼資料,或在使用者輸出資料集中寫入新的狀態資料表。中繼資料的範例包括工作狀態和指標。
識別資訊提供者的計費方式
為簡化客戶帳單和新手上路流程,建議您將實體解析服務整合至 Google Cloud Marketplace。您可以根據實體解析作業用量設定定價模式,並由 Google 為您處理帳單事宜。詳情請參閱「提供軟體即服務 (SaaS) 產品」。