Salesforce 일괄 소스 플러그인을 사용하여 BigQuery에서 리드 데이터 분석

Cloud Data Fusion에서 Salesforce 일괄 소스 플러그인을 사용하여 BigQuery에서 리드 데이터를 분석하는 방법을 알아봅니다.


Google Cloud 콘솔에서 이 태스크에 대한 단계별 안내를 직접 수행하려면 둘러보기를 클릭합니다.

둘러보기


시나리오

마케팅 관리자가 신제품 홍보를 위해 고도로 타겟팅된 이메일 마케팅 캠페인을 계획한다고 가정해 보겠습니다. Salesforce Sales Cloud에 리드 목록이 있습니다. 타겟 캠페인을 만들기 전에 타겟층을 더 잘 이해하려면 Cloud Data Fusion에서 Salesforce 일괄 소스 플러그인을 사용하여 특정 리드 데이터를 추출해야 합니다.

시작하기 전에

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc APIs.

    Enable the APIs

  7. Cloud Data Fusion 인스턴스를 만듭니다.
  8. Cloud Data Fusion용 Salesforce 연결된 앱을 만들어 Salesforce API에 대한 연결을 구성합니다.

권한 관리

필요한 커스텀 역할 및 권한을 만들고 할당합니다.

커스텀 역할 만들기 및 권한 추가

  1. Google Cloud 콘솔에서 역할 페이지로 이동합니다.

    역할로 이동

  2. 역할 만들기를 클릭합니다.

  3. 제목 필드에 Custom Role-Tutorial을 입력합니다.

  4. 권한 추가를 클릭합니다.

  5. 권한 추가 창에서 다음 권한을 선택하고 추가를 클릭합니다.

    • bigquery.datasets.create
    • bigquery.jobs.create
    • storage.buckets.create
  6. 만들기를 클릭합니다.

기본 Compute Engine 서비스 계정에 커스텀 역할 할당

  1. Cloud Data Fusion 인스턴스 페이지로 이동합니다.

    인스턴스로 이동

  2. 인스턴스의 이름을 클릭합니다.

  3. 기본 Compute Engine 서비스 계정을 확인합니다. 인스턴스 세부정보 페이지에 이 정보가 포함되어 있습니다.

    Cloud Data Fusion 기본 Compute Engine 서비스 계정 이름의 형식은 CUSTOMER_PROJECT_NUMBER-compute@developer.gserviceaccount.com입니다.

  4. IAM 페이지로 이동합니다.

    IAM으로 이동

  5. 파일러 표시줄에 기본 Compute Engine 서비스 계정의 이름을 입력합니다.

  6. 기본 Compute Engine 서비스 계정에서 수정을 클릭합니다.

  7. 다른 역할 추가를 클릭합니다.

  8. 역할 선택 필드에서 커스텀 역할 튜토리얼을 선택합니다.

  9. 저장을 클릭합니다.

Cloud Data Fusion Salesforce 배치 소스 플러그인 구성

  1. Cloud Data Fusion 인스턴스 페이지로 이동합니다.

    인스턴스로 이동

  2. 인스턴스의 인스턴스 보기를 클릭합니다. Cloud Data Fusion 웹 인터페이스가 열립니다.

  3. Studio 페이지로 이동합니다.

  4. 허브를 클릭합니다.

  5. 검색창에 Salesforce를 입력합니다.

  6. Salesforce 플러그인을 클릭한 다음 배포를 클릭합니다.

  7. Salesforce 플러그인 배포 창에서 완료를 클릭합니다.

    배포가 완료되면 성공 메시지가 포함된 대화상자가 표시됩니다.

  8. 해당 대화상자에서 파이프라인 만들기를 클릭합니다.

    Cloud Data Fusion Studio 페이지가 표시됩니다.

  9. 데이터 파이프라인 유형으로 데이터 파이프라인 - 배치를 선택합니다.

  10. 소스 메뉴에서 Salesforce를 클릭합니다.

  11. Salesforce 노드로 이동하여 속성을 클릭합니다. 그러면 Salesforce 플러그인 속성 페이지가 열립니다.

  12. 참조 이름 필드에 소스 이름을 입력합니다. 예를 들면 Leads_generated입니다.

  13. 연결 섹션에서 연결 사용 전환 버튼을 클릭합니다.

  14. 연결 찾아보기를 클릭합니다. 연결 찾아보기 창이 열립니다.

  15. 연결 추가를 클릭하고 Salesforce를 선택합니다.

  16. Salesforce 연결 만들기 창에서 구성 탭을 클릭하고 다음을 수행합니다.

    1. 이름 필드에 연결을 식별할 이름(예: Salesforce_connection)을 입력합니다.

    2. 사용자 인증 정보 섹션에 Salesforce 계정의 다음 세부정보를 입력합니다.

      • 사용자 이름
      • 비밀번호
      • 고객 키
      • 고객 비밀번호
      • 보안 토큰
    3. 연결 테스트를 클릭합니다. 입력된 세부정보가 올바르면 '연결됨'이라는 메시지가 표시되며 테스트가 성공합니다.

    4. 만들기를 클릭합니다.

    5. Salesforce_connection을 선택하고 Salesforce 플러그인 속성 페이지로 돌아갑니다.

Salesforce 배치 소스 플러그인에서 데이터 추출

  1. Salesforce 플러그인 속성 페이지의 SOQL 쿼리 섹션에서 다음 쿼리를 입력합니다.

    Select LastName,FirstName,Company,Email,Phone,LeadSource,Industry,OwnerId,CreatedDate,LastModifiedDate,LastActivityDate from Lead where Status like '%Open%'
    

    이 쿼리는 sObject Lead에서 캠페인을 실행하는 데 필요한 잠재적 리드의 세부정보를 가져옵니다.

  2. 객체 스키마의 유효성을 확인하려면 스키마 가져오기를 클릭합니다.

  3. 캠페인을 실행할 특정 날짜 또는 시간의 레코드를 필터링하려면 다음 필드를 사용합니다.

    • 다음 날짜 이후에 최종 수정
    • 다음 날짜 이전에 최종 수정
    • 기간
    • 오프셋
데이터를 추출하는 SOQL 쿼리

Wrangler 플러그인을 사용하여 데이터 변환

Cloud Data Fusion에서 Wrangler 플러그인을 사용하여 데이터를 정리하고 보강합니다.

  1. Studio 페이지로 돌아갑니다.

  2. 변환 메뉴에서 Wrangler를 클릭합니다.

  3. Wrangler를 Salesforce 배치 소스 플러그인에 연결합니다.

  4. Wrangler 플러그인으로 이동하여 속성을 클릭합니다. 그러면 Wrangler 플러그인 속성 페이지가 열립니다.

  5. 입력 스키마가 채워져 있는지 확인하세요.

  6. Wrangle을 클릭합니다.

  7. 연결 창에서 유효한 연결을 선택합니다.

  8. 변환하려는 sObject를 선택합니다(예: Lead).

  9. 필수 지시어로 데이터를 변환합니다.

    keep :LastName,:FirstName,:Company,:Phone,:Email,:LeadSource,:OwnerId,
    :CreatedDate,:LastModifiedDate,:LastActivityDatemerge :FirstName :LastName :Name ' '
    fill-null-or-empty :Email 'no email found'
    mask-number :Phone ########xxxxxxxx
    format-date :LastActivityDate yyyy-MM-dd HH:mm:ss
    drop :LastName,:FirstName
    
    데이터 변환

BigQuery에 데이터 로드

  1. Studio 페이지로 돌아갑니다.

  2. 싱크 메뉴에서 BigQuery를 클릭합니다.

  3. BigQuery 노드로 이동하고 속성을 클릭합니다. 그러면 BigQuery 플러그인 속성 페이지가 열립니다.

  4. 기본 섹션의 참조 이름 필드에 이 싱크를 식별하는 이름을 입력합니다. 예를 들면 Leads_generated입니다.

  5. 데이터 세트 필드에 테이블이 속한 데이터 세트를 입력합니다. 예를 들면 Salesforce_Leads입니다.

  6. 테이블 필드에 추출된 레코드를 저장해야 하는 테이블을 입력합니다. 예를 들면 Incoming_Open_Leads입니다.

  7. 플러그인을 검사하려면 검사를 클릭합니다.

데이터 로드

파이프라인 배포, 예약, 실행

  1. 파이프라인을 배포하려면 배포를 클릭합니다.

  2. 스케줄러를 사용하여 적절한 새로고침 일정을 설정하려면 다음 단계를 따르세요.

    1. 일정을 클릭합니다.
    2. 다음 세부정보를 입력합니다.

      • 파이프라인 실행 반복
      • 반복 간격
      • 시작 가격
      • 최대 동시 실행
      • 컴퓨팅 프로필
    3. 일정 저장 및 시작을 클릭합니다.

    파이프라인 배포 및 실행

  3. 파이프라인을 실행하려면 실행을 클릭합니다.

데이터 추출 및 수집 확인

  1. Google Cloud console에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 추출된 레코드를 보려면 데이터 세트 Salesforce_Leads와 테이블 이름 Incoming_Open_Leads를 검색합니다.

  3. 쿼리를 실행하려면 쿼리를 클릭합니다.

리드 데이터를 분석하여 잠재고객을 보다 잘 이해하고 맞춤설정된 캠페인을 대규모로 게재합니다.

삭제

이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 수행합니다.

Cloud Data Fusion 인스턴스 삭제

다음 안내에 따라 Cloud Data Fusion 인스턴스를 삭제합니다.

프로젝트 삭제

비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.

프로젝트를 삭제하는 방법은 다음과 같습니다.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

다음 단계