Google Play 전송

Google Play용 BigQuery Data Transfer Service를 사용하면 Google Play 보고 데이터의 반복되는 로드 작업을 자동으로 예약하고 관리할 수 있습니다.

지원되는 보고서

Google Play용 BigQuery Data Transfer Service는 다음과 같은 월별 보고 옵션을 지원합니다.

세부 보고서

집계 보고서

Google Play 보고서가 BigQuery 테이블로 변환되는 방식에 대한 자세한 내용은 Google Play 보고서 변환을 참조하세요.

보고 옵션 지원
지원되는 API 버전

해당 없음

일정

매일, 전송이 처음 만들어진 시간(기본값)

시간을 구성할 수 있습니다.

새로고침 기간

지난 7일

구성할 수 없음

최대 백필 기간

제한 없음

Google Play에는 알려진 데이터 보관 제한이 없지만, BigQuery Data Transfer Service에는 하나의 백필에서 요청 가능한 일수에 제한이 있습니다. 백필에 대한 자세한 내용은 백필 설정을 참조하세요.

Google Play 전송에서 데이터 수집

Google Play에서 BigQuery로 데이터를 전송할 때는 데이터가 날짜별로 파티션을 나눈 BigQuery 테이블에 로드됩니다. 데이터가 로드되는 테이블 파티션은 데이터 소스의 날짜에 해당합니다. 동일한 날짜에 여러 전송을 예약하면 BigQuery Data Transfer Service가 해당 날짜의 파티션을 최신 데이터로 덮어씁니다. 동일한 일자에 전송이 여러 개 있어도 데이터가 중복되지 않으며 다른 일자의 파티션에 영향을 주지 않습니다.

제한사항

  • 데이터 전송을 예약할 수 있는 최소 빈도는 24시간에 한 번입니다. 기본적으로 전송은 사용자가 전송을 만드는 시간에 시작됩니다. 하지만 전송을 설정할 때 전송 시작 시간을 구성할 수 있습니다.
  • BigQuery Data Transfer Service는 Google Play 전송 중 증분 전송을 지원하지 않습니다. 데이터 전송에 대해 날짜를 지정하면 해당 날짜에 사용 가능한 모든 데이터가 전송됩니다.

시작하기 전에

Google Play 전송을 만들기 전에 다음을 수행하세요.

  • BigQuery Data Transfer Service 사용 설정에 필요한 모든 작업을 완료했는지 확인합니다.
  • Google Play 데이터를 저장할 BigQuery 데이터 세트를 만듭니다.
  • Cloud Storage 버킷을 찾습니다.
    1. Google Play 콘솔에서 보고서 다운로드를 클릭하고 미리보기, 통계, 재무를 선택합니다.
    2. Cloud Storage 버킷의 ID를 복사하려면 Cloud Storage URI 복사를 클릭합니다. 버킷 ID는 gs://로 시작합니다. 예를 들어 검토 보고서의 경우 ID가 다음과 비슷합니다.
      gs://pubsite_prod_rev_01234567890987654321/reviews
    3. Google Play 전송의 경우 gs:///reviews 사이의 고유 ID만 복사해야 합니다.
      pubsite_prod_rev_01234567890987654321
  • Pub/Sub의 전송 실행 알림을 설정하려면 pubsub.topics.setIamPolicy 권한이 있어야 합니다. 이메일 알림만 설정한다면 Pub/Sub 권한이 필요하지 않습니다. 자세한 내용은 BigQuery Data Transfer Service 실행 알림을 참조하세요.

필수 권한

  • BigQuery: 전송을 만드는 사람에게 다음과 같은 BigQuery의 권한이 있는지 확인합니다.

    • 전송을 만들 bigquery.transfers.update 권한
    • 대상 데이터 세트에 대한 bigquery.datasets.getbigquery.datasets.update 권한

    사전 정의된 IAM 역할 bigquery.admin에는 bigquery.transfers.update, bigquery.datasets.update, bigquery.datasets.get 권한이 있습니다. BigQuery Data Transfer Service의 IAM 역할에 대한 자세한 내용은 액세스 제어를 확인하세요.

  • Google Play: 다음과 같은 Google Play의 권한이 있는지 확인합니다.

    Google Cloud팀은 사용자를 대신하여 Google Play 파일에 대한 액세스 권한을 생성하거나 부여할 수 없습니다. Google Play 파일 액세스에 관한 도움말은 Google Play 지원팀에 문의하기를 참조하세요.

Google Play 전송 설정

Google Play 전송 설정에 필요한 사항은 다음과 같습니다.

  • Cloud Storage 버킷 - Cloud Storage 버킷을 찾는 단계는 시작하기 전에 섹션에 설명되어 있습니다. Cloud Storage 버킷은 pubsite_prod_rev로 시작합니다. 예를 들면 pubsite_prod_rev_01234567890987654321입니다.
  • 테이블 서픽스. 동일한 데이터세트에 로드되는 모든 데이터 소스에 사용하는 사용자 친화적인 이름입니다. 서픽스는 동일한 테이블에 개별 전송이 기록되는 경우를 방지하려는 목적으로 사용합니다. 테이블 서픽스는 같은 데이터세트에 데이터를 로드하는 모든 전송에서 고유해야 하며 결과 테이블 이름의 길이를 최소화하도록 짧은 서픽스를 사용해야 합니다.

Google Play 전송을 설정하는 방법:

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery 페이지로 이동

  2. 전송을 클릭합니다.

  3. 전송 만들기를 클릭합니다.

  4. 전송 만들기 페이지에서 다음을 수행합니다.

    • 소스 유형 섹션의 소스에서 Google Play를 선택합니다.

      전송 소스

    • 전송 구성 이름 섹션의 표시 이름에 전송 이름(예: My Transfer)을 입력합니다. 전송 이름은 나중에 수정해야 할 경우에 전송을 식별할 수 있는 값이면 됩니다.

      전송 이름

    • 일정 옵션 섹션에서 다음을 수행합니다.

      • 반복 빈도에 대해 전송을 실행하려는 빈도 옵션을 선택합니다. 을 선택한 경우 UTC로 유효한 시간을 제공합니다.

        • 시간
        • 주문형
      • 해당하는 경우 지금 시작 또는 설정 시간에 시작을 선택하고 시작 날짜와 실행 시간을 제공합니다.

    • 대상 설정 섹션의 대상 데이터세트에서 데이터를 저장하기 위해 만든 데이터세트를 선택합니다.

      전송 데이터 세트

    • 데이터 소스 세부정보 섹션에서 다음을 수행합니다.

      • Cloud Storage 버킷에는 Cloud Storage 버킷 ID를 입력합니다.
      • 테이블 서픽스에는 'MT'('My Transfer'의 약자)와 같은 서픽스를 입력합니다.

        Google Play 소스 세부정보

    • (선택사항) 알림 옵션 섹션에서 다음을 수행합니다.

      • 전환을 클릭해서 이메일 알림을 사용 설정합니다. 이 옵션을 사용 설정하면 전송 실행이 실패할 때 전송 관리자에게 이메일 알림이 발송됩니다.
      • Pub/Sub 주제 선택에서 주제 이름을 선택하거나 주제 만들기를 클릭합니다. 이 옵션은 전송에 대한 Pub/Sub 실행 알림을 구성합니다.
  5. 저장을 클릭합니다.

bq

bq mk 명령어를 입력하고 전송 생성 플래그 --transfer_config를 지정합니다. 다음 플래그도 필요합니다.

  • --target_dataset
  • --display_name
  • --params
  • --data_source
bq mk \
--transfer_config \
--project_id=project_id \
--target_dataset=dataset \
--display_name=name \
--params='parameters' \
--data_source=data_source

각 항목의 의미는 다음과 같습니다.

  • project_id는 프로젝트 ID입니다. --project_id를 지정하지 않으면 기본 프로젝트가 사용됩니다.
  • dataset는 전송 구성 대상 데이터 세트입니다.
  • name은 전송 구성의 표시 이름입니다. 전송 이름은 나중에 수정해야 할 경우에 전송을 쉽게 식별할 수 있는 값이면 됩니다.
  • parameters에는 JSON 형식으로 생성된 전송 구성의 매개변수가 있습니다. 예를 들면 --params='{"param":"param_value"}'입니다. Google Play의 경우 buckettable_suffix 매개변수를 제공해야 합니다. bucket은 Play 보고서 파일이 포함된 Cloud Storage 버킷입니다.
  • data_source는 데이터 소스(play)입니다.

예를 들어 다음 명령어는 Cloud Storage 버킷 pubsite_prod_rev_01234567890987654321과 대상 데이터 세트 mydataset를 사용하는 My Transfer라는 Google Play 전송을 만듭니다. 기본 프로젝트에 전송이 생성됩니다.

bq mk \
--transfer_config \
--target_dataset=mydataset \
--display_name='My Transfer' \
--params='{"bucket":"pubsite_prod_rev_01234567890987654321","table_suffix":"MT"}' \
--data_source=play

명령어를 처음 실행하면 다음과 같은 메시지가 수신됩니다.

[URL omitted] Please copy and paste the above URL into your web browser and follow the instructions to retrieve an authentication code.

메시지 안내를 따라 명령줄에 인증 코드를 붙여넣습니다.

API

projects.locations.transferConfigs.create 메서드를 사용하고 TransferConfig 리소스의 인스턴스를 지정합니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참조 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.

import com.google.api.gax.rpc.ApiException;
import com.google.cloud.bigquery.datatransfer.v1.CreateTransferConfigRequest;
import com.google.cloud.bigquery.datatransfer.v1.DataTransferServiceClient;
import com.google.cloud.bigquery.datatransfer.v1.ProjectName;
import com.google.cloud.bigquery.datatransfer.v1.TransferConfig;
import com.google.protobuf.Struct;
import com.google.protobuf.Value;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

// Sample to create a play transfer config.
public class CreatePlayTransfer {

  public static void main(String[] args) throws IOException {
    // TODO(developer): Replace these variables before running the sample.
    final String projectId = "MY_PROJECT_ID";
    String datasetId = "MY_DATASET_ID";
    String bucket = "gs://cloud-sample-data";
    String tableSuffix = "_test";
    Map<String, Value> params = new HashMap<>();
    params.put("bucket", Value.newBuilder().setStringValue(bucket).build());
    params.put("table_suffix", Value.newBuilder().setStringValue(tableSuffix).build());
    TransferConfig transferConfig =
        TransferConfig.newBuilder()
            .setDestinationDatasetId(datasetId)
            .setDisplayName("Your Play Config Name")
            .setDataSourceId("play")
            .setParams(Struct.newBuilder().putAllFields(params).build())
            .build();
    createPlayTransfer(projectId, transferConfig);
  }

  public static void createPlayTransfer(String projectId, TransferConfig transferConfig)
      throws IOException {
    try (DataTransferServiceClient client = DataTransferServiceClient.create()) {
      ProjectName parent = ProjectName.of(projectId);
      CreateTransferConfigRequest request =
          CreateTransferConfigRequest.newBuilder()
              .setParent(parent.toString())
              .setTransferConfig(transferConfig)
              .build();
      TransferConfig config = client.createTransferConfig(request);
      System.out.println("play transfer created successfully :" + config.getName());
    } catch (ApiException ex) {
      System.out.print("play transfer was not created." + ex.toString());
    }
  }
}

Google Play 전송 설정 문제 해결

전송을 설정하는 데 문제가 있으면 BigQuery Data Transfer Service 전송 설정 문제 해결을 참조하세요.

데이터 쿼리

BigQuery로 전송되는 데이터는 내부 데이터화 시간별로 파티션을 나눈 테이블에 기록됩니다. 자세한 내용은 파티션을 나눈 테이블 소개를 참조하세요.

자동 생성된 뷰를 사용하지 않고 직접 테이블을 쿼리하는 경우에는 쿼리에서 _PARTITIONTIME 유사 열을 사용해야 합니다. 자세한 내용은 파티션을 나눈 테이블 쿼리를 참조하세요.

가격 책정

Google Play 전송 가격 책정에 대한 자세한 내용은 가격 책정 페이지를 참조하세요.

데이터가 BigQuery로 전송되면 표준 BigQuery 스토리지쿼리 가격 책정이 적용됩니다.

다음 단계