BigQuery에서 항목 확인 구성 및 사용

이 문서에서는 항목 확인 최종 사용자(이하 최종 사용자로 지칭) 및 ID 공급업체의 항목 확인을 구현하는 방법을 보여줍니다.

최종 사용자는 이 문서를 사용하여 ID 공급업체에 연결하고 공급업체의 서비스를 사용하여 레코드를 일치시킬 수 있습니다. ID 공급업체는 이 문서를 사용하여 Google Cloud Marketplace에서 최종 사용자와 공유할 서비스를 설정 및 구성할 수 있습니다.

최종 사용자용 워크플로

다음 섹션에서는 최종 사용자가 BigQuery에서 항목 확인을 구성하는 방법을 보여줍니다. 전체 설정을 시각적으로 확인하려면 항목 확인 아키텍처를 참조하세요.

시작하기 전에

  1. ID 공급업체에 문의하여 관계를 설정합니다. BigQuery는 LiveRampTransUnion을 사용한 항목 확인을 지원합니다.
  2. ID 공급업체에서 다음 항목을 얻습니다.
    • 서비스 계정 사용자 인증 정보
    • 원격 함수 서명
  3. 프로젝트에 데이터 세트 두 개를 만듭니다.
    • 입력 데이터 세트
    • 출력 데이터 세트

필요한 역할

항목 확인 작업을 실행하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

  • ID 공급업체의 서비스 계정이 입력 데이터 세트를 읽고 출력 데이터 세트에 쓰기 위한 역할:

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

항목 변환 또는 확인

특정 ID 공급업체 안내는 다음 섹션을 참조하세요.

LiveRamp

기본 요건

  • BigQuery에서 LiveRamp 임베디드 ID 구성 자세한 내용은 BigQuery에서 LiveRamp 임베디드 ID 사용 설정을 참조하세요.
  • LiveRamp와 함께 임베디드 ID와 함께 사용할 수 있도록 API 사용자 인증 정보를 사용 설정합니다. 자세한 내용은 인증을 참조하세요.

설정

LiveRamp 임베디드 ID를 처음 사용하는 경우 다음 단계를 수행해야 합니다. 설정이 완료되면 실행 간에 입력 테이블과 메타데이터 테이블만 수정하면 됩니다.

입력 테이블 만들기

입력 데이터 세트에 테이블을 만듭니다. RampID, 대상 도메인, 대상 유형으로 테이블을 채웁니다. 자세한 내용과 예시는 입력 테이블 열 및 설명을 참조하세요.

메타데이터 테이블 만들기

메타데이터 테이블은 BigQuery에서 LiveRamp 임베디드 ID 실행을 제어하는 데 사용됩니다. 입력 데이터 세트에 메타데이터 테이블을 만듭니다. 메타데이터 테이블에 클라이언트 ID, 실행 모드, 대상 도메인, 대상 유형을 채웁니다. 자세한 내용과 예시는 메타데이터 테이블 열 및 설명을 참조하세요.

LiveRamp와 테이블 공유

LiveRamp Google Cloud 서비스 계정에 입력 데이터 세트의 데이터를 보고 처리할 수 있는 액세스 권한을 부여합니다. 자세한 내용과 예시는 LiveRamp와 테이블 및 데이터 세트 공유를 참조하세요.

임베디드 ID 작업 실행

BigQuery에서 LiveRamp로 임베디드 ID 작업을 실행하려면 다음을 수행하세요.

  1. 도메인에 인코딩된 모든 RampID가 입력 테이블에 있는지 확인합니다.
  2. 작업을 실행하기 전에 메타데이터 테이블이 여전히 정확한지 확인합니다.
  3. 작업 프로세스 요청은 LiveRampIdentitySupport@liveramp.com으로 문의하세요. 입력 테이블, 메타데이터 테이블, 출력 데이터 세트의 프로젝트 ID, 데이터 세트 ID, 테이블 ID(해당하는 경우)를 포함합니다. 자세한 내용은 LiveRamp에서 트랜스코딩을 시작하도록 알림을 참조하세요.

결과는 일반적으로 영업일 기준 3일 이내에 출력 데이터 세트에 제공됩니다.

LiveRamp 지원

지원 문제는 LiveRamp ID 지원에 문의하세요.

LiveRamp 결제

LiveRamp에서 항목 확인의 결제를 처리합니다.

TransUnion

기본 요건

  • 서비스에 액세스하기 위한 계약을 체결하려면 TransUnion Cloud 지원팀에 문의하세요.Google Cloud 프로젝트 ID, 입력 데이터 유형, 사용 사례, 데이터 볼륨의 세부정보를 제공합니다.
  • TransUnion Cloud 지원팀에서 Google Cloud 프로젝트에 대해 서비스를 사용 설정하고 사용 가능한 출력 데이터를 포함한 자세한 구현 가이드를 공유합니다.

설정

BigQuery 환경에서 TransUnion의 TruAudience 신원 확인 및 보강 서비스를 사용하는 경우 다음 단계가 필요합니다.

외부 연결 만들기

Vertex AI 원격 모델, 원격 함수, BigLake (Cloud 리소스) 유형의 외부 데이터 소스에 연결을 만듭니다. 이 연결을 사용하여Google Cloud 계정에서 TransUnion Google Cloud 계정에 호스팅된 ID 확인 서비스를 트리거합니다.

연결 ID와 서비스 계정 ID를 복사하여 TransUnion 고객 제공팀과 공유합니다.

원격 함수 만들기

TransUnion Google Cloud 프로젝트에서 호스팅되는 서비스 오케스트레이터 엔드포인트와 상호작용하여 필요한 메타데이터 (스키마 매핑 포함)를 TransUnion 서비스에 전달하는 원격 함수를 만듭니다. 생성한 외부 연결의 연결 ID와 TransUnion 고객 제공팀에서 공유한 TransUnion 호스팅 Cloud 함수 엔드포인트를 사용합니다.

입력 테이블 만들기

입력 데이터 세트에 테이블을 만듭니다. TransUnion은 이름, 우편 주소, 이메일, 전화번호, 생년월일, IPv4 주소, 기기 ID를 입력으로 지원합니다. TransUnion에서 공유한 구현 가이드의 서식 가이드라인을 따르세요.

메타데이터 테이블 만들기

스키마 매핑을 비롯해 ID 확인 서비스가 데이터를 처리하는 데 필요한 구성을 저장할 메타데이터 테이블을 만듭니다. 자세한 내용과 예시는 TransUnion에서 공유한 구현 가이드를 참고하세요.

작업 상태 표 만들기

입력 배치 처리에 관한 업데이트를 수신할 테이블을 만듭니다. 이 테이블을 쿼리하여 파이프라인에서 다른 다운스트림 프로세스를 트리거할 수 있습니다. 가능한 작업 상태는 RUNNING, COMPLETED, ERROR입니다.

서비스 호출 만들기

모든 메타데이터를 수집하고, 패키징하고, TransUnion에서 호스팅하는 호출 클라우드 함수 엔드포인트에 전달한 후 다음 절차에 따라 TransUnion ID 확인 서비스를 호출합니다.

-- create service invocation procedure
CREATE OR REPLACE
  PROCEDURE
    `<project_id>.<dataset_id>.TransUnion_get_identities`(metadata_table STRING, config_id STRING)
      begin
        declare sql_query STRING;

declare json_result STRING;
declare base64_result STRING;

SET sql_query =
  '''select to_json_string(array_agg(struct(config_id,key,value))) from `''' || metadata_table
  || '''` where  config_id="''' || config_id || '''" ''';

EXECUTE immediate sql_query INTO json_result;

SET base64_result = (SELECT to_base64(CAST(json_result AS bytes)));

SELECT `<project_id>.<dataset_id>.remote_call_TransUnion_er`(base64_result);

END;
일치하는 출력 테이블 만들기

다음 SQL 스크립트를 실행하여 일치하는 출력 테이블을 만듭니다. 애플리케이션의 표준 출력으로, 일치 플래그, 점수, 영구적인 개인 ID, 가구 ID가 포함됩니다.

-- create output table
CREATE TABLE `<project_id>.<dataset_id>.TransUnion_identity_output`(
  batchid STRING,
  uniqueid STRING,
  ekey STRING,
  hhid STRING,
  collaborationid STRING,
  firstnamematch STRING,
  lastnamematch STRING,
  addressmatches STRING,
  addresslinkagescores STRING,
  phonematches STRING,
  phonelinkagescores STRING,
  emailmatches STRING,
  emaillinkagescores STRING,
  dobmatches STRING,
  doblinkagescore STRING,
  ipmatches STRING,
  iplinkagescore STRING,
  devicematches STRING,
  devicelinkagescore STRING,
  lastprocessed STRING);
메타데이터 구성

TransUnion에서 공유한 구현 가이드에 따라 입력 스키마를 애플리케이션 스키마에 매핑합니다. 이 메타데이터는 데이터 클린룸에서 사용할 수 있는 공유 가능한 비영구 식별자인 협업 ID의 생성도 구성합니다.

읽기 및 쓰기 액세스 권한 부여

TransUnion 고객 제공팀에서 Apache Spark 연결의 서비스 계정 ID를 가져와 입력 및 출력 테이블이 포함된 데이터 세트에 대한 읽기 및 쓰기 액세스 권한을 부여합니다. 데이터 세트에 BigQuery 데이터 편집자 역할이 있는 서비스 계정 ID를 제공하는 것이 좋습니다.

애플리케이션 호출

다음 스크립트를 실행하여 환경 내에서 애플리케이션을 호출할 수 있습니다.

call `<project_id>.<dataset_id>.TransUnion_get_identities`("<project_id>.<dataset_id>.TransUnion_er_metadata","1");
-- using metadata table, and 1 = config_id for the batch run

지원

기술적인 문제가 있는 경우 TransUnion Cloud 지원팀에 문의하세요.

결제 및 사용량

TransUnion은 애플리케이션 사용량을 추적하고 이를 결제 목적으로 사용합니다. 활성 고객은 TransUnion 제공 담당자에게 문의하여 자세한 내용을 확인할 수 있습니다.

ID 공급업체용 워크플로

다음 섹션에서는 ID 공급업체가 BigQuery에서 항목 확인을 구성하는 방법을 보여줍니다. 전체 설정을 시각적으로 확인하려면 항목 확인 아키텍처를 참조하세요.

시작하기 전에

  1. 원격 함수와 통합할 Cloud Run 작업 또는 Cloud Run 함수를 만듭니다. 두 옵션 모두 이 목적에 적합합니다.
  2. Cloud Run 또는 Cloud Run 함수와 연결된 서비스 계정의 이름을 확인합니다.

    1. Google Cloud 콘솔에서 Cloud Functions 페이지로 이동합니다.

      Cloud Functions로 이동

    2. 함수 이름을 클릭한 후 세부정보 탭을 클릭합니다.

    3. 일반 정보 창에서 원격 함수의 서비스 계정 이름을 찾아 확인합니다.

  3. 원격 함수를 만듭니다.

  4. 최종 사용자로부터 최종 사용자 주 구성원을 수집합니다.

필요한 역할

항목 확인 작업을 실행하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

  • 함수와 연결된 서비스 계정에서 연결된 데이터 세트를 읽고 쓰고 작업을 실행하기 위한 역할:
  • 최종 사용자 주 구성원이 원격 함수를 보고 연결하기 위한 역할:

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

항목 확인 원격 함수 공유

다음 원격 인터페이스 코드를 수정하여 최종 사용자와 공유합니다. 최종 사용자가 항목 확인 작업을 시작하려면 이 코드가 필요합니다.

`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)

LIST_OF_PARAMETERS를 원격 함수에 전달된 파라미터 목록으로 바꿉니다.

선택사항: 작업 메타데이터 제공

원하는 경우 별도의 원격 함수를 사용하거나 사용자의 출력 데이터 세트에 새 상태 테이블을 작성하여 작업 메타데이터를 제공할 수 있습니다. 메타데이터의 예시로는 작업 상태 및 측정항목이 있습니다.

ID 공급업체용 결제

고객 결제 및 온보딩을 간소화하기 위해 항목 확인 서비스를 Google Cloud Marketplace와 통합하는 것이 좋습니다. 그러면 항목 확인 작업 사용량을 기준으로 가격 책정 모델을 설정할 수 있으며 Google에서 결제를 자동으로 처리합니다. 자세한 내용은 Software as a Service(SaaS) 제품 제공을 참조하세요.