파티션을 나눈 테이블 관리

이 문서에서는 BigQuery에서 파티션을 나눈 테이블을 관리하는 방법을 설명합니다. 수집 시간으로 파티션을 나눈 테이블과 파티션을 나눈 테이블은 모두 같은 방식으로 관리합니다. 파티션을 나눈 테이블에는 다음과 같은 관리 작업을 할 수 있습니다.

  • 시간으로 파티션을 나눈 테이블의 다음 속성 업데이트
    • 설명
    • 테이블 만료 시간
    • 파티션 만료 시간
    • 파티션 필터 요구사항
    • 스키마 정의
    • 라벨
  • 시간으로 파티션을 나눈 테이블의 이름 바꾸기(복사)
  • 시간으로 파티션을 나눈 테이블 복사
  • 파티션 복사
  • 시간으로 파티션을 나눈 테이블 삭제
  • 시간으로 파티션을 나눈 테이블의 파티션 삭제

테이블 정보 가져오기, 테이블 나열, 테이블 데이터에 대한 액세스 제어를 비롯한 파티션을 나눈 테이블 만들기 및 사용에 대한 자세한 내용은 수집 시간으로 파티션을 나눈 테이블 만들기 및 사용 또는 파티션을 나눈 테이블 만들기 및 사용을 참조하세요.

파티션을 나눈 테이블 속성 업데이트

파티션을 나눈 테이블의 다음 속성을 업데이트할 수 있습니다.

  • 설명
  • 테이블 만료 시간
  • 파티션 만료 시간
  • 스키마 정의
  • 라벨

필수 권한

테이블 속성을 업데이트하려면 최소한 bigquery.tables.updatebigquery.tables.get 권한이 부여되어 있어야 합니다. 다음과 같은 사전 정의된 IAM 역할에는 bigquery.tables.update 권한과 bigquery.tables.get 권한이 포함되어 있습니다.

  • bigquery.dataEditor
  • bigquery.dataOwner
  • bigquery.admin

또한 bigquery.datasets.create 권한이 있는 사용자는 데이터 세트를 만들 때 해당 데이터 세트에 대한 bigquery.dataOwner 액세스 권한을 부여받습니다. bigquery.dataOwner 액세스 권한이 있는 사용자는 해당 데이터세트의 테이블 속성을 업데이트할 수 있습니다.

BigQuery의 IAM 역할과 권한에 대한 자세한 내용은 사전 정의된 역할 및 권한을 참조하세요.

파티션을 나눈 테이블의 설명 업데이트

파티션을 나눈 테이블의 설명을 업데이트하는 프로세스는 표준 테이블의 설명을 업데이트하는 프로세스와 동일합니다. 테이블 설명을 추가하고 변경하는 방법에 대한 자세한 내용은 테이블 설명 업데이트를 참조하세요.

현재 개별 파티션에 대한 설명은 작성할 수 없습니다.

테이블 만료 시간 업데이트

파티션을 나눈 테이블의 만료 시간을 업데이트하는 프로세스는 표준 테이블의 만료 시간을 업데이트하는 프로세스와 동일합니다. 테이블 만료를 추가하고 변경하는 방법에 대한 자세한 내용은 테이블 만료 시간 업데이트를 참조하세요.

파티션 만료 시간 업데이트

수집 시간 또는 날짜/타임스탬프 열로 파티션을 나눈 테이블을 만들 때 파티션 만료 시간을 지정할 수 있습니다. 이 값을 지정하면 데이터 세트 수준의 기본 파티션 만료 시간이 재정의됩니다. 정수 범위의 파티션을 나눈 테이블은 파티션 만료 시간을 지원하지 않습니다. 자세한 내용은 수집 시간으로 파티션을 나눈 테이블 만들기 및 사용날짜/타임스탬프로 파티션을 나눈 테이블 만들기 및 사용을 참조하세요.

테이블을 만든 후 언제든지 bq 명령줄 도구의 bq update 명령어 또는 API tables.patch 메서드를 사용하여 테이블의 파티션 만료 시간을 업데이트할 수 있습니다. 현재 Cloud Console에서는 파티션 만료 시간 업데이트가 지원되지 않습니다. 그러나 DDL 문을 사용하면 Cloud Console에서 파티션 만료 시간을 업데이트할 수 있습니다.

테이블의 파티션 만료 시간을 업데이트하면 해당 설정이 파티션 생성 시기에 관계없이 모든 파티션에 적용됩니다.

테이블의 파티션 만료 시간을 업데이트할 때는 파티션 날짜의 UTC 자정부터 파티션 만료 시간을 계산해야 합니다.

파티션을 나눈 테이블에 테이블 만료 시간이 구성되어 있으면 테이블 만료 시간 설정에 따라 테이블과 테이블의 모든 파티션이 삭제됩니다. 테이블 만료는 파티션 만료보다 우선 적용됩니다.

예를 들어 파티션을 나눈 테이블의 만료 시간은 5일로 설정되고 파티션 만료 시간이 7일로 설정되어 있으면 테이블과 모든 파티션은 5일 후에 삭제됩니다.

2016년 12월 13일 이전에 만든 파티션을 나눈 테이블이 있는 프로젝트의 파티션 만료 시간은 파티션이 마지막으로 수정된 날짜를 기준으로 합니다. 이 동작은 해당 프로젝트에서 생성되는 새 테이블에도 적용됩니다. 프로젝트를 새 동작으로 이전하려면 BigQuery 문제 추적기에서 요청을 제출해야 합니다.

파티션을 나눈 테이블의 파티션 만료 시간을 업데이트하려면 다음 안내를 따르세요.

SQL

데이터 정의 언어(DDL) 문을 사용하면 표준 SQL 쿼리 구문으로 테이블과 뷰를 만들고 수정할 수 있습니다.

자세한 내용은 데이터 정의 언어 문 사용을 참조하세요.

DDL 문을 사용하여 파티션을 나눈 테이블의 파티션 만료 시간을 업데이트하려면 다음 안내를 따르세요.

  1. Cloud Console에서 BigQuery 페이지를 엽니다.

    BigQuery 페이지로 이동

  2. 새 쿼리 작성을 클릭합니다.

  3. 쿼리 편집기 텍스트 영역에 DDL 문을 입력합니다.

     ALTER TABLE mydataset.mytable
     SET OPTIONS (
       -- Sets partition expiration to 5 days
       partition_expiration_days=5
     )
     

  4. 실행을 클릭합니다.

bq

bq update 명령어를 --time_partitioning_expiration 플래그와 함께 실행합니다. 기본 프로젝트가 아닌 다른 프로젝트의 파티션을 나눈 테이블을 업데이트하려면 해당 프로젝트 ID를 project_id:dataset 형식으로 데이터세트 이름에 추가합니다.

bq update \
--time_partitioning_expiration integer \
project_id:dataset.table

각 항목의 의미는 다음과 같습니다.

  • integer는 테이블 파티션의 기본 수명(단위: 초)입니다. 최솟값은 없습니다. 만료 시간은 파티션의 날짜와 정수 값을 더한 값입니다. 0을 지정하면 파티션 만료 시간이 삭제되고 파티션이 만료되지 않습니다. 만료 시간이 없는 파티션은 수동으로 삭제해야 합니다.
  • project_id는 프로젝트 ID입니다.
  • dataset는 업데이트할 테이블이 포함되어 있는 데이터세트의 이름입니다.
  • table은 업데이트할 테이블의 이름입니다.

예를 들면 다음과 같습니다.

mydataset.mytable의 파티션 만료 시간을 5일(432,000초)로 업데이트하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트에 있습니다.

bq update --time_partitioning_expiration 432000 mydataset.mytable

mydataset.mytable의 파티션 만료 시간을 5일(432,000초)로 업데이트하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트가 아닌 myotherproject에 있습니다.

bq update \
--time_partitioning_expiration 432000 \
myotherproject:mydataset.mytable

API

tables.patch 메서드를 호출하고 timePartitioning.expirationMs 속성을 사용하여 파티션 만료 시간을 밀리초 단위로 업데이트합니다. tables.update 메서드는 전체 테이블 리소스를 바꾸기 때문에 tables.patch 메서드를 사용하는 것이 좋습니다.

파티션 필터 요구사항 업데이트

파티션을 나눈 테이블을 만들 때 파티션 필터 필요 옵션을 사용 설정하여 조건자 필터를 반드시 사용하도록 지정할 수 있습니다. 이 옵션이 적용된 경우 WHERE 절을 지정하지 않고 파티션을 나눈 테이블을 쿼리하려고 하면 Cannot query over table 'project_id.dataset.table' without a filter that can be used for partition elimination과 같은 오류가 발생합니다.

파티션을 나눈 테이블을 만들 때 파티션 필터 필요 옵션을 추가하는 방법에 대한 자세한 내용은 파티션을 나눈 테이블 만들기를 참조하세요.

파티션을 나눈 테이블을 만들 때 파티션 필터 필요 옵션을 사용 설정하지 않았다면 테이블을 업데이트하여 해당 옵션을 추가할 수 있습니다.

파티션 필터 필요 옵션 업데이트

파티션을 프루닝하는 WHERE 절이 포함된 쿼리를 요구하도록 파티션을 나눈 테이블을 업데이트하려면 다음을 사용하세요.

Console

파티션을 나눈 테이블이 생성된 후에는 Cloud Console을 사용하여 파티션 필터를 필수로 지정할 수 없습니다.

bq

bq 명령줄 도구를 사용하여 파티션 필터를 요구하도록 파티션을 나눈 테이블을 업데이트하려면 bq update 명령어를 입력하고 --require_partition_filter 플래그를 지정합니다.

기본 프로젝트가 아닌 다른 프로젝트의 파티션을 나눈 테이블을 업데이트하려면 해당 프로젝트 ID를 project_id:dataset 형식으로 데이터 세트에 추가합니다.

예를 들면 다음과 같습니다.

기본 프로젝트에 있는 mydatasetmypartitionedtable을 업데이트하려면 다음을 입력합니다.

bq update --require_partition_filter mydataset.mytable

myotherproject에 있는 mydatasetmypartitionedtable을 업데이트하려면 다음을 입력합니다.

bq update --require_partition_filter myotherproject:mydataset.mytable

API

tables.patch 메서드를 호출하고 requirePartitionFilter 속성을 true로 설정하여 파티션 필터를 필수로 지정합니다. tables.update 메서드는 전체 테이블 리소스를 바꾸기 때문에 tables.patch 메서드를 사용하는 것이 좋습니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 자바 설정 안내를 따르세요. 자세한 내용은 BigQuery 자바 API 참조 문서를 확인하세요.

import com.google.cloud.bigquery.BigQuery;
import com.google.cloud.bigquery.BigQueryException;
import com.google.cloud.bigquery.BigQueryOptions;
import com.google.cloud.bigquery.Table;

// Sample to update require partition filter on a table.
public class UpdateTableRequirePartitionFilter {

  public static void runUpdateTableRequirePartitionFilter() {
    // TODO(developer): Replace these variables before running the sample.
    String datasetName = "MY_DATASET_NAME";
    String tableName = "MY_TABLE_NAME";
    updateTableRequirePartitionFilter(datasetName, tableName);
  }

  public static void updateTableRequirePartitionFilter(String datasetName, String tableName) {
    try {
      // Initialize client that will be used to send requests. This client only needs to be created
      // once, and can be reused for multiple requests.
      BigQuery bigquery = BigQueryOptions.getDefaultInstance().getService();

      Table table = bigquery.getTable(datasetName, tableName);
      table.toBuilder().setRequirePartitionFilter(true).build().update();

      System.out.println("Table require partition filter updated successfully");
    } catch (BigQueryException e) {
      System.out.println("Table require partition filter was not updated \n" + e.toString());
    }
  }
}

스키마 정의 업데이트

파티션을 나눈 테이블의 스키마 정의를 업데이트하는 프로세스는 표준 테이블의 스키마 정의를 업데이트하는 프로세스와 동일합니다. 자세한 내용은 테이블 스키마 수정을 참조하세요.

파티션을 나눈 테이블 이름 바꾸기

현재는 기존 파티션 테이블의 이름을 변경할 수 없습니다. 테이블 이름을 변경해야 한다면 테이블 복사 단계를 따라야 합니다. 복사 작업에서 대상 테이블을 지정할 때는 새 테이블 이름을 사용해야 합니다.

파티션을 나눈 테이블 복사

한 개의 파티션을 나눈 테이블 복사

파티션을 나눈 테이블을 복사하는 프로세스는 표준 테이블을 복사하는 프로세스와 동일합니다. 자세한 내용은 테이블 복사를 참조하세요.

파티션을 나눈 테이블을 복사할 때는 다음에 유의하세요.

  • 원본과 대상 테이블은 같은 위치의 데이터세트에 있어야 합니다.

  • 파티션을 나눈 테이블을 파티션을 나눈 새 대상 테이블에 복사
    시간으로 파티션을 나눈 테이블을 새 테이블에 복사하면 모든 파티션 나누기 정보가 테이블과 함께 복사됩니다. 따라서 새 테이블과 이전 테이블의 파티션이 동일하게 됩니다.
  • 파티션을 나누지 않은 테이블을 파티션을 나눈 테이블에 복사
    파티션을 나누지 않은 테이블을 파티션을 나눈 테이블에 복사하면 BigQuery는 소스 데이터를 현재 날짜를 나타내는 파티션에 복사합니다.
  • 파티션을 나눈 테이블을 다른 테이블(파티션을 나눈 테이블)에 복사
    파티션을 나눈 테이블을 다른 테이블(파티션을 나눈 테이블)에 복사하려면 소스 테이블과 대상 테이블의 파티션 사양이 일치해야 합니다. 데이터를 대상 테이블에 추가할지 또는 덮어쓸지 지정할 수 있습니다.
  • 파티션을 나눈 테이블을 파티션을 나누지 않은 테이블에 복사
    파티션을 나눈 테이블을 파티션을 나누지 않은 테이블에 복사하면 대상 테이블에서는 파티션이 나눠지지 않습니다. 데이터는 설정에 따라 파티션을 나누지 않은 테이블에 추가되거나 해당 테이블을 덮어씁니다.

여러 개의 파티션을 나눈 테이블 복사

여러 개의 파티션을 나눈 테이블을 복사하는 프로세스는 여러 개의 표준 테이블을 복사하는 프로세스와 동일합니다. 자세한 정보는 소스 테이블 여러 개 복사를 참조하세요.

여러 개의 파티션을 나눈 테이블을 복사할 때는 다음에 유의하세요.

  • 여러 개의 소스 테이블을 같은 작업의 파티션을 나눈 테이블 하나에 복사할 때는 소스 테이블에 파티션을 나눈 테이블과 파티션을 나누지 않은 테이블이 혼재해서는 안 됩니다.
  • 모든 소스 테이블이 파티션을 나눈 테이블이라면 모든 소스 테이블의 파티션 사양이 대상 테이블의 파티션 사양과 일치해야 합니다. 설정에 따라 대상 테이블을 추가할지 또는 덮어쓸지 결정합니다.
  • 원본과 대상 테이블은 같은 위치의 데이터세트에 있어야 합니다.

파티션 복사

다음을 수행하여 하나 이상의 파티션을 복사할 수 있습니다.

  • bq 명령줄 도구의 bq cp 명령어 사용
  • jobs.insert API 메서드를 호출하고 copy 작업 구성
  • 클라이언트 라이브러리 사용

현재 Cloud Console에서는 파티션을 복사할 수 없습니다.

필수 권한

테이블 및 파티션을 복사하려면 최소한 다음 권한을 부여받아야 합니다.

소스 데이터 세트에 대한 권한:

  • bigquery.tables.get
  • bigquery.tables.getData

대상 데이터 세트에 대한 권한:

  • bigquery.tables.create - 대상 데이터 세트에서 테이블 또는 파티션의 복사본을 만드는 데 필요한 권한

다음과 같은 사전 정의된 IAM 역할에는 bigquery.tables.create, bigquery.tables.get, bigquery.tables.getData 권한이 포함되어 있습니다.

  • bigquery.dataEditor
  • bigquery.dataOwner
  • bigquery.admin

또한 복사 작업을 실행하려면 bigquery.jobs.create 권한을 부여받아야 합니다.

다음과 같은 사전 정의된 IAM 역할에는 bigquery.jobs.create 권한이 포함되어 있습니다.

  • bigquery.user
  • bigquery.jobUser
  • bigquery.admin

또한 bigquery.datasets.create 권한이 있는 사용자는 데이터 세트를 만들 때 해당 데이터 세트에 대한 bigquery.dataOwner 액세스 권한을 부여받습니다. bigquery.dataOwner 액세스 권한이 있는 사용자는 데이터세트에서 테이블과 파티션을 복사할 수 있지만 대상 데이터세트가 자신이 만든 것이 아니라면 대상 데이터세트에 대한 액세스 권한을 부여받아야 합니다.

BigQuery의 IAM 역할과 권한에 대한 자세한 내용은 사전 정의된 역할 및 권한을 참조하세요.

단일 파티션 복사

Console

Cloud Console에서는 파티션을 복사할 수 없습니다.

bq

파티션을 복사하려면 bq 명령줄 도구의 bq cp(copy) 명령어와 $20160201 같은 파티션 데코레이터($date)를 함께 사용합니다.

선택적 플래그를 사용하면 대상 파티션의 쓰기 처리를 제어할 수 있습니다.

  • -a 또는 --append_table은 소스 파티션의 데이터를 대상 데이터세트의 기존 테이블 또는 파티션에 추가합니다.
  • -f 또는 --force는 대상 데이터세트의 기존 테이블 또는 파티션을 덮어쓰며 확인 메시지를 표시하지 않습니다.
  • -n 또는 --no_clobber는 해당 테이블 또는 파티션이 대상 데이터세트에 이미 있는 경우 Table '<var>project_id:dataset.table</var> or <var>table$date</var>' already exists, skipping. 오류 메시지를 반환합니다. -n을 지정하지 않으면 기본적으로 대상 테이블 또는 파티션을 대체할지 묻는 메시지가 표시됩니다.
  • --destination_kms_key는 대상 테이블 또는 파티션을 암호화하는 데 사용되는 고객 관리 Cloud KMS 키입니다.

cp 명령어는 --time_partitioning_field 또는 --time_partitioning_type 플래그를 지원하지 않습니다. 수집 시간으로 파티션을 나눈 테이블을 복사 작업을 통해 파티션을 나눈 테이블로 변환할 수는 없습니다.

여기서는 --destination_kms_key를 설명하지 않습니다. 자세한 내용은 Cloud KMS 키로 데이터 보호를 참조하세요.

소스 데이터세트 또는 대상 데이터세트가 기본 프로젝트가 아닌 다른 프로젝트에 있으면 프로젝트 ID를 project_id:dataset 형식으로 데이터세트 이름에 추가합니다.

(선택사항) --location 플래그를 지정하고 값을 사용자 위치로 설정합니다.

bq --location=location cp \
-a -f -n \
project_id:dataset.source_table$source_partition \
project_id:dataset.destination_table$destination_partition

각 항목의 의미는 다음과 같습니다.

  • location은 사용자 위치의 이름입니다. --location 플래그는 선택사항입니다. 예를 들어 도쿄 리전에서 BigQuery를 사용하는 경우에는 플래그 값을 asia-northeast1로 설정할 수 있습니다. .bigqueryrc 파일을 사용하여 위치 기본값을 설정할 수 있습니다.
  • project_id는 프로젝트 ID입니다.
  • dataset는 소스 또는 대상 데이터세트의 이름입니다.
  • source_table은 복사할 테이블입니다.
  • source_partition은 소스 파티션의 파티션 데코레이터입니다.
  • destination_table은 대상 데이터세트의 테이블 이름입니다.
  • destination_partition은 대상 파티션의 파티션 데코레이터입니다.

예를 들면 다음과 같습니다.

새 테이블에 파티션 복사

mydataset.mytable의 2018년 1월 30일 파티션을 새 테이블 mydataset.mytable2에 복사하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트에 있습니다.

bq cp -a 'mydataset.mytable$20180130' mydataset.mytable2

파티션을 나누지 않은 테이블에 파티션 복사

mydataset.mytable의 2018년 1월 30일 파티션을 mydataset2.mytable2라는 이름의 파티션을 나누지 않은 테이블에 복사하려면 다음 명령어를 입력합니다. -a 단축키를 사용하면 파티션의 데이터가 파티션을 나누지 않은 대상 테이블에 추가됩니다. 여기서 두 데이터세트는 모두 기본 프로젝트에 있습니다.

bq cp -a 'mydataset.mytable$20180130' mydataset2.mytable2

mydataset.mytable의 2018년 1월 30일 파티션을 mydataset2.mytable2라는 이름의 파티션을 나누지 않은 테이블에 복사하려면 다음 명령어를 입력합니다. -f 단축키를 사용하면 확인 메시지 없이 파티션을 나누지 않은 대상 테이블을 덮어씁니다.

bq --location=US cp -f 'mydataset.mytable$20180130' mydataset2.mytable2

파티션을 나눈 다른 테이블에 파티션 복사

mydataset.mytable의 2018년 1월 30일 파티션을 mydataset2.mytable2라는 이름의 파티션을 나눈 다른 테이블에 복사하려면 다음 명령어를 입력합니다. -a 단축키를 사용하면 파티션의 데이터가 대상 테이블에 추가됩니다. 대상 테이블에 파티션 데코레이터가 지정되지 않았기 때문에 소스 파티션 키가 유지되고 대상 테이블의 2018년 1월 30일 파티션에 데이터가 복사됩니다. 대상 테이블에 파티션 데코레이터를 지정하여 데이터를 특정 파티션에 복사할 수도 있습니다. 여기서 mydataset는 기본 프로젝트에 있습니다. mydataset2는 기본 프로젝트가 아닌 myotherproject에 있습니다.

bq --location=US cp \
-a \
'mydataset.mytable$20180130' \
myotherproject:mydataset2.mytable2

mydataset.mytable의 2018년 1월 30일 파티션을 mydataset2.mytable2라는 이름의 파티션을 나눈 다른 테이블에 있는 2018년 2월 20일 파티션에 복사하려면 다음 명령어를 입력합니다. -f 단축키를 사용하면 대상 테이블의 2018년 2월 20일 파티션을 확인 메시지 없이 덮어씁니다. 파티션 데코레이터를 사용하지 않으면 대상 테이블의 모든 데이터를 덮어쓰게 됩니다. 여기서 mydataset는 기본 프로젝트에 있습니다. mydataset2는 기본 프로젝트가 아닌 myotherproject에 있습니다.

bq cp \
-f \
'mydataset.mytable$20180130' \
'myotherproject:mydataset2.mytable2$20180220'

mydataset.mytable의 2018년 1월 30일 파티션을 mydataset2.mytable2라는 이름의 파티션을 나눈 다른 테이블에 복사하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트에 있습니다. mydataset2는 기본 프로젝트가 아닌 myotherproject에 있습니다. 대상 테이블에 데이터가 있으면 덮어쓸지 여부를 묻는 메시지가 기본적으로 표시됩니다.

bq cp \
'mydataset.mytable$20180130' \
myotherproject:mydataset2.mytable2

API

jobs.insert 메서드를 호출하고 copy 작업을 구성합니다. (선택사항) 작업 리소스jobReference 섹션에 있는 location 속성에 사용자 리전을 지정합니다.

작업 구성에 다음 속성을 지정합니다.

  • sourceTables 속성에 소스 데이터세트, 테이블, 파티션을 입력합니다.
  • destinationTable 속성에 대상 데이터세트와 테이블을 입력합니다.
  • writeDisposition 속성을 사용하여 데이터를 대상 테이블 또는 파티션에 추가할지 또는 덮어쓸지 지정합니다.

여러 개의 파티션 복사

여러 개의 파티션을 복사하려면 다음 안내를 따르세요.

Console

현재 Cloud Console에서는 파티션을 복사할 수 없습니다.

bq

여러 개의 파티션 복사는 한 개의 파티션 복사와 프로세스가 동일하지만 여러 개의 소스 파티션을 쉼표로 구분된 목록으로 지정해야 합니다.

bq cp \
'mydataset.mytable$20180130,mydataset.mytable$20180131' \
myotherproject:mydataset.mytable2

API

jobs.insert 메서드를 호출하고 copy 작업을 구성합니다. 작업 리소스jobReference 섹션에 있는 location 속성에 사용자 리전을 지정합니다.

작업 구성에 다음 속성을 지정합니다.

  • sourceTables 속성에 데이터세트와 테이블 이름을 포함하여 소스 파티션을 여러 개 입력합니다.
  • destinationTable 속성에 대상 데이터세트와 테이블을 입력합니다.
  • writeDisposition 속성을 사용하여 데이터를 대상 테이블 또는 파티션에 추가할지 또는 덮어쓸지 지정합니다.

파티션을 나눈 테이블 삭제

파티션을 나눈 테이블을 삭제하는 프로세스는 표준 테이블을 삭제하는 프로세스와 동일합니다. 테이블 삭제에 대한 자세한 내용은 테이블 삭제를 참조하세요.

파티션을 나눈 테이블의 파티션 삭제

bq 명령줄 도구의 bq rm 명령어를 사용하거나 tables.delete API 메서드를 호출하여 파티션을 나눈 테이블의 파티션을 삭제할 수 있습니다.

파티션 데코레이터를 사용하여 특정 파티션을 삭제할 수 있습니다. 예를 들어 다음 명령어를 사용하여 파티션을 나눈 테이블 mydataset.mytable의 2016년 3월 1일 파티션($20160301)을 삭제할 수 있습니다.

bq rm 'mydataset.mytable$20160301'

파티션을 나눈 테이블의 파티션 목록을 검색하려면 수집 시간으로 파티션을 나눈 테이블의 파티션 나열 또는 파티션을 나눈 테이블의 파티션 나열을 참조하세요.

현재는 한 번에 하나의 파티션만 삭제할 수 있습니다.

필수 권한

파티션을 삭제하려면 최소한 bigquery.tables.deletebigquery.tables.get 권한이 부여되어 있어야 합니다. 다음과 같은 사전 정의된 IAM 역할에는 bigquery.tables.delete 권한과 bigquery.tables.get 권한이 포함되어 있습니다.

  • bigquery.dataOwner
  • bigquery.dataEditor
  • bigquery.admin

또한 bigquery.datasets.create 권한이 있는 사용자는 데이터 세트를 만들 때 해당 데이터 세트에 대한 bigquery.dataOwner 액세스 권한을 부여받습니다. bigquery.dataOwner 액세스 권한이 있는 사용자는 데이터세트에서 테이블 및 파티션을 삭제할 수 있습니다.

BigQuery의 IAM 역할과 권한에 대한 자세한 내용은 사전 정의된 역할 및 권한을 참조하세요.

파티션을 나눈 테이블의 파티션 삭제

두 개의 특수 파티션 중 하나가 아니라면 파티션 데코레이터를 지정하여 파티션을 삭제할 수 있습니다. 현재 __NULL__ 또는 __UNPARTITIONED__ 파티션은 삭제할 수 없습니다.

파티션을 나눈 테이블의 파티션을 삭제하려면 다음 안내를 따르세요.

Console

Cloud Console에서는 파티션을 삭제할 수 없습니다.

bq

bq rm 명령어를 --table 플래그(또는 -t 단축키)와 함께 사용하고 파티션 데코레이터($date)를 참조하여 파티션을 나눈 테이블의 특정 파티션을 삭제할 수 있습니다. bq 명령줄 도구를 사용하여 파티션을 삭제할 때는 작업을 확인해야 합니다. --force 플래그(또는 -f 단축키)를 사용하면 확인 절차를 건너뛸 수 있습니다.

파티션을 나눈 테이블이 기본 프로젝트가 아닌 다른 프로젝트의 데이터세트에 있으면 해당 프로젝트 ID를 project_id:dataset 형식으로 데이터세트 이름에 추가합니다.

bq rm -f -t project_id:dataset.table$date

각 항목의 의미는 다음과 같습니다.

  • project_id는 프로젝트 ID입니다.
  • dataset는 테이블이 포함된 데이터세트의 이름입니다.
  • table은 테이블의 이름입니다.
  • $date는 삭제할 파티션의 파티션 데코레이터입니다.

예를 들면 다음과 같습니다.

파티션을 나눈 테이블 mydataset.mytable에서 2016년 3월 1일 파티션($20160301)을 삭제하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트에 있습니다.

bq rm 'mydataset.mytable$20160301'

파티션을 나눈 테이블 mydataset.mytable에서 2017년 1월 1일 파티션($20170101)을 삭제하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트가 아닌 myotherproject에 있습니다.

bq rm 'myotherproject:mydataset.mytable$20170101'

파티션을 나눈 테이블 mydataset.mytable에서 2018년 1월 18일 파티션($20180118)을 삭제하려면 다음 명령어를 입력합니다. 여기서 mydataset는 기본 프로젝트가 아닌 myotherproject에 있습니다. -f 단축키를 사용하면 확인을 건너뜁니다.

bq rm -f 'myotherproject:mydataset.mytable$20180118'

API

tables.delete 메서드를 호출하고 tableId 매개변수를 사용하여 테이블 및 파티션 데코레이터를 지정합니다.