Salesforce 일괄 소스 플러그인을 사용하여 BigQuery에서 리드 데이터 분석

Cloud Data Fusion에서 Salesforce 일괄 소스 플러그인을 사용하여 BigQuery에서 리드 데이터를 분석하는 방법을 알아봅니다.


Google Cloud 콘솔에서 이 태스크에 대한 단계별 안내를 직접 수행하려면 둘러보기를 클릭합니다.

둘러보기


시나리오

새 제품을 홍보하기 위해 고도로 타겟팅된 이메일 마케팅 캠페인을 계획 중인 마케팅 관리자가 있다고 가정해 보겠습니다. Salesforce Sales Cloud에 리드 목록이 있습니다. 타겟팅된 캠페인을 만들기 전에 타겟층을 더 잘 이해하기 위해서는 Cloud Data Fusion에서 Salesforce Batch Source 플러그인을 사용하여 특정 리드 데이터를 추출해야 합니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  5. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  6. API Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc 사용 설정

    API 사용 설정

  7. Cloud Data Fusion 인스턴스를 만듭니다.
  8. Cloud Data Fusion용 Salesforce 연결 앱을 만들어 Salesforce API에 대한 연결을 구성합니다.

권한 관리

필요한 커스텀 역할 및 권한을 만들고 할당합니다.

커스텀 역할 만들기 및 권한 추가

  1. Google Cloud 콘솔에서 역할 페이지로 이동합니다.

    역할로 이동

  2. 역할 만들기를 클릭합니다.

  3. 제목 필드에 Custom Role-Tutorial을 입력합니다.

  4. 권한 추가를 클릭합니다.

  5. 권한 추가 창에서 다음 권한을 선택하고 추가를 클릭합니다.

    • bigquery.datasets.create
    • bigquery.jobs.create
    • storage.buckets.create
  6. 만들기를 클릭합니다.

기본 Compute Engine 서비스 계정에 커스텀 역할 할당

  1. Cloud Data Fusion 인스턴스 페이지로 이동합니다.

    인스턴스로 이동

  2. 인스턴스의 이름을 클릭합니다.

  3. 기본 Compute Engine 서비스 계정을 기록해 둡니다. 인스턴스 세부정보 페이지에 이 정보가 포함되어 있습니다.

    Cloud Data Fusion 기본 Compute Engine 서비스 계정 이름의 형식은 CUSTOMER_PROJECT_NUMBER-compute@developer.gserviceaccount.com입니다.

  4. IAM 페이지로 이동합니다.

    IAM으로 이동

  5. 파일러 표시줄에 기본 Compute Engine 서비스 계정의 이름을 입력합니다.

  6. 기본 Compute Engine 서비스 계정에서 수정을 클릭합니다.

  7. 다른 역할 추가를 클릭합니다.

  8. 역할 선택 필드에서 커스텀 역할 튜토리얼을 선택합니다.

  9. 저장을 클릭합니다.

Cloud Data Fusion Salesforce Batch Source 플러그인 구성

  1. Cloud Data Fusion 인스턴스 페이지로 이동합니다.

    인스턴스로 이동

  2. 내 인스턴스에서 인스턴스 보기를 클릭합니다. Cloud Data Fusion 웹 인터페이스가 열립니다.

  3. Studio 페이지로 이동합니다.

  4. 허브를 클릭합니다.

  5. 검색창에 Salesforce를 입력합니다.

  6. Salesforce 플러그인을 클릭한 다음 배포를 클릭합니다.

  7. Salesforce 플러그인 배포 창에서 마침을 클릭합니다.

    배포가 완료되면 성공 메시지가 포함된 대화상자가 표시됩니다.

  8. 이 대화상자에서 파이프라인 만들기를 클릭합니다.

    Cloud Data Fusion Studio 페이지가 표시됩니다.

  9. 데이터 파이프라인 유형으로 데이터 파이프라인 - 일괄을 선택합니다.

  10. 소스 메뉴에서 Salesforce를 클릭합니다.

  11. Salesforce 노드로 이동하여 속성을 클릭합니다. 그러면 Salesforce 플러그인 속성 페이지가 열립니다.

  12. 참조 이름 필드에 소스 이름을 입력합니다. 예를 들면 Leads_generated입니다.

  13. 연결 섹션에서 연결 사용 전환 버튼을 클릭합니다.

  14. 연결 찾아보기를 클릭합니다. 연결 찾아보기 창이 열립니다.

  15. 연결 추가를 클릭하고 Salesforce를 선택합니다.

  16. Salesforce 연결 만들기 창에서 구성 탭을 클릭하고 다음을 수행합니다.

    1. 이름 필드에 연결을 식별할 이름을 입력합니다(예: Salesforce_connection).

    2. 사용자 인증 정보 섹션에서 Salesforce 계정의 다음 세부정보를 입력합니다.

      • 사용자 이름
      • 비밀번호
      • 고객 키
      • 고객 비밀번호
      • 보안 토큰
    3. 연결 테스트를 클릭합니다. 입력한 세부정보가 올바르면 테스트가 성공하며 '성공적으로 연결됨'이라는 메시지가 표시됩니다.

    4. 만들기를 클릭합니다.

    5. Salesforce_connection을 선택하고 Salesforce 플러그인 속성 페이지로 돌아갑니다.

Salesforce Batch Source 플러그인에서 데이터 추출

  1. Salesforce 플러그인 속성 페이지의 SOQL 쿼리 섹션에서 다음 쿼리를 입력합니다.

    Select LastName,FirstName,Company,Email,Phone,LeadSource,Industry,OwnerId,CreatedDate,LastModifiedDate,LastActivityDate from Lead where Status like '%Open%'
    

    이 쿼리는 sObject Lead에서 캠페인을 실행하는 데 필요한 잠재적 리드의 세부정보를 가져옵니다.

  2. 객체 스키마의 유효성을 확인하려면 스키마 가져오기를 클릭합니다.

  3. 캠페인을 실행하기 위한 특정 날짜 또는 시간의 레코드를 필터링하려면 다음 필드를 사용합니다.

    • 다음 날짜 이후에 최종 수정
    • 다음 날짜 이전에 최종 수정
    • 소요 시간
    • 오프셋
데이터를 추출하기 위한 SOQL 쿼리

Wrangler 플러그인을 사용하여 데이터 변환

Cloud Data Fusion에서 Wrangler 플러그인을 사용하여 데이터를 정리하고 보강합니다.

  1. Studio 페이지로 돌아갑니다.

  2. 변환 메뉴에서 Wrangler를 클릭합니다.

  3. Wrangler를 Salesforce Batch Source 플러그인에 연결합니다.

  4. Wrangler 플러그인으로 이동하여 속성을 클릭합니다. 그러면 Wrangler 플러그인 속성 페이지가 열립니다.

  5. 입력 스키마가 채워져 있는지 확인합니다.

  6. Wrangle을 클릭합니다.

  7. 연결 창에서 유효한 연결을 선택합니다.

  8. 변환할 sObject를 선택합니다(예: Lead).

  9. 필수 지시문을 사용하여 데이터를 변환합니다.

    keep :LastName,:FirstName,:Company,:Phone,:Email,:LeadSource,:OwnerId,
    :CreatedDate,:LastModifiedDate,:LastActivityDatemerge :FirstName :LastName :Name ' '
    fill-null-or-empty :Email 'no email found'
    mask-number :Phone ########xxxxxxxx
    format-date :LastActivityDate yyyy-MM-dd HH:mm:ss
    drop :LastName,:FirstName
    
    데이터 변환

BigQuery에 데이터 로드

  1. Studio 페이지로 돌아갑니다.

  2. 싱크 메뉴에서 BigQuery를 클릭합니다.

  3. BigQuery 노드로 이동하여 BigQuery을 클릭합니다. 그러면 BigQuery 플러그인 속성 페이지가 열립니다.

  4. 기본 섹션의 참조 이름 필드에 이 싱크를 식별할 이름을 입력합니다. 예를 들면 Leads_generated입니다.

  5. 데이터 세트 필드에 테이블이 속한 데이터 세트를 입력합니다. 예를 들면 Salesforce_Leads입니다.

  6. 테이블 필드에 추출된 레코드를 저장해야 하는 테이블을 입력합니다. 예를 들면 Incoming_Open_Leads입니다.

  7. 플러그인을 검사하려면 검사를 클릭합니다.

데이터 로드

파이프라인 배포, 예약, 실행

  1. 파이프라인을 배포하려면 배포를 클릭합니다.

  2. 스케줄러를 사용하여 적절한 새로고침 일정을 설정하려면 다음 단계를 따르세요.

    1. 일정을 클릭합니다.
    2. 다음 세부정보를 입력합니다.

      • 파이프라인 실행 반복
      • 반복 간격
      • 시작 가격
      • 최대 동시 실행
      • 컴퓨팅 프로필
    3. 예약 저장 및 시작을 클릭합니다.

    파이프라인 배포 및 실행

  3. 파이프라인을 실행하려면 실행을 클릭합니다.

데이터 추출 및 수집 확인

  1. Google Cloud console에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 추출된 레코드를 보려면 데이터 세트 Salesforce_Leads와 테이블 이름 Incoming_Open_Leads를 검색합니다.

  3. 쿼리를 실행하려면 쿼리를 클릭합니다.

리드 데이터를 분석하여 잠재고객을 보다 잘 이해하고 맞춤화된 캠페인을 대규모로 제공할 수 있습니다.

삭제

이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 수행합니다.

Cloud Data Fusion 인스턴스 삭제

다음 안내에 따라 Cloud Data Fusion 인스턴스를 삭제합니다.

프로젝트 삭제

비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.

프로젝트를 삭제하는 방법은 다음과 같습니다.

  1. Google Cloud 콘솔에서 리소스 관리 페이지로 이동합니다.

    리소스 관리로 이동

  2. 프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제를 클릭합니다.
  3. 대화상자에서 프로젝트 ID를 입력한 후 종료를 클릭하여 프로젝트를 삭제합니다.

다음 단계