비용 예측 및 관리
이 페이지에서는 BigQuery에서 비용을 추정하고 관리하기 위한 권장사항을 설명합니다.
BigQuery의 기본 비용은 쿼리 처리에 사용되는 컴퓨팅과 BigQuery에 로드된 데이터의 스토리지입니다. BigQuery에서는 쿼리 처리를 위한 두 가지 유형의 가격 책정 모델, 주문형 가격과 용량 기반 가격을 제공합니다. 각 모델은 비용 관리를 위한 서로 다른 권장사항을 제공합니다. BigQuery에 저장된 데이터의 경우 비용은 각 데이터 세트에 구성된 스토리지 결제 모델에 따라 다릅니다.
쿼리 비용 관리
개별 쿼리의 비용을 관리하려면 먼저 쿼리 계산 최적화 및 스토리지 최적화에 관한 권장사항을 따르는 것이 좋습니다.
다음 섹션에서는 쿼리 비용을 추가로 관리하는 데 사용할 수 있는 추가 권장사항을 간략하게 설명합니다.
쿼리를 실행하기 전에 예상 비용 확인
권장사항: 쿼리를 실행하기 전에 먼저 미리보기를 통해 예상 비용을 알아보세요.
주문형 가격 책정 모델을 사용하는 경우 쿼리는 읽은 바이트 수에 따라 요금이 청구됩니다. 쿼리를 실행하기 전에 예상 비용을 알아보려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 쿼리 검사기를 사용합니다.
- 쿼리에 대한 테스트 실행을 수행합니다.
쿼리 검사기 사용
Google Cloud 콘솔에 쿼리를 입력하면 쿼리 검사기가 쿼리 구문을 확인하고 읽을 바이트 수를 추정합니다. 이 추정값을 사용하여 가격 계산기에서 쿼리 비용을 계산할 수 있습니다.
쿼리가 유효하지 않으면 쿼리 검사기에 오류 메시지가 표시됩니다. 예를 들면 다음과 같습니다.
Not found: Table myProject:myDataset.myTable was not found in location US
쿼리가 유효하면 쿼리 검사기에서 쿼리를 처리하는 데 필요한 바이트 수를 추정합니다. 예를 들면 다음과 같습니다.
This query will process 623.1 KiB when run.
테스트 실행 수행
시험 이전을 수행하려면 다음을 수행합니다.
콘솔
BigQuery 페이지로 이동합니다.
쿼리 편집기에 쿼리를 입력합니다.
쿼리가 유효하면 쿼리에서 처리할 데이터 양과 함께 체크표시가 자동으로 표시됩니다. 쿼리가 유효하지 않으면 느낌표가 오류 메시지와 함께 표시됩니다.
bq
--dry_run
플래그를 사용하여 다음과 같은 쿼리를 입력합니다.
bq query \ --use_legacy_sql=false \ --dry_run \ 'SELECT COUNTRY, AIRPORT, IATA FROM `project_id`.dataset.airports LIMIT 1000'
유효한 쿼리인 경우 이 명령어는 다음 응답을 생성합니다.
Query successfully validated. Assuming the tables are not modified, running this query will process 10918 bytes of data.
API
API를 사용하여 테스트 실행을 수행하려면 JobConfiguration 유형에서 dryRun
을 true
로 설정한 채로 쿼리 작업을 제출합니다.
Go
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Go 설정 안내를 따르세요. 자세한 내용은 BigQuery Go API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
자바
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
Node.js
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Node.js 설정 안내를 따르세요. 자세한 내용은 BigQuery Node.js API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
PHP
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 PHP 설정 안내를 따르세요. 자세한 내용은 BigQuery PHP API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
Python
QueryJobConfig.dry_run 속성을 True
로 설정합니다.
테스트 실행 쿼리 구성을 제공하면 Client.query()는 항상 완료된 QueryJob을 반환합니다.
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
쿼리 비용 추정
주문형 가격 책정 모델을 사용하는 경우 처리된 바이트 수를 계산하여 쿼리 실행 비용을 추정할 수 있습니다.
주문형 쿼리 크기 계산
다양한 유형의 쿼리에서 처리되는 바이트 수를 계산하려면 다음 섹션을 참고하세요.
쿼리를 실행하여 테이블 데이터 탐색 방지
권장사항: 쿼리를 실행하여 테이블 데이터를 탐색하거나 미리 보지 마세요.
데이터를 실험하거나 탐색하는 경우, 테이블 미리보기 옵션을 사용하여 할당량에 영향을 주지 않으면서 데이터를 무료로 볼 수 있습니다.
BigQuery는 다음과 같은 데이터 미리보기 옵션을 지원합니다.
- Google Cloud 콘솔의 테이블 세부정보 페이지에서 미리보기 탭을 클릭하여 데이터를 샘플링합니다.
- bq 명령줄 도구에서
bq head
명령어를 사용하여 미리보기를 수행할 행 번호를 지정합니다. - API에서
tabledata.list
를 사용하여 지정된 행 세트에서 테이블 데이터를 검색합니다. - 클러스터링되지 않은 테이블에서
LIMIT
를 사용하지 마세요. 클러스터링되지 않은 테이블의 경우LIMIT
절은 컴퓨팅 비용을 줄이지 않습니다.
쿼리당 청구되는 바이트 수 제한
권장사항: 주문형 가격 책정 모델을 사용할 때는 청구 가능한 최대 바이트 설정을 사용하여 쿼리 비용을 제한하세요.
청구 가능한 최대 바이트 설정을 사용하여 쿼리에 대해 청구되는 바이트 수를 제한할 수 있습니다. 청구 가능한 최대 바이트를 설정하면 쿼리가 실행되기 전에 쿼리가 읽는 바이트 수가 추정됩니다. 예상 바이트 수가 한도를 초과하면 비용이 발생하지 않고 쿼리는 실패합니다.
클러스터링된 테이블의 경우 쿼리에 청구되는 바이트 수의 추정값은 상한값이며, 쿼리 실행 후 청구되는 실제 바이트 수보다 클 수 있습니다. 따라서 경우에 따라 청구 가능한 최대 바이트를 설정한 경우 청구 가능한 실제 바이트가 청구 가능한 최대 바이트 설정을 초과하지 않더라도 클러스터링된 테이블의 쿼리가 실패할 수 있습니다.
청구 가능한 최대 바이트 설정으로 인해 쿼리가 실패하면 다음과 비슷한 오류가 반환됩니다.
Error: Query exceeded limit for bytes billed: 1000000. 10485760 or higher
required.
청구 가능한 최대 바이트를 설정하려면 다음을 따르세요.
콘솔
- 쿼리 편집기에서 더보기 > 쿼리 설정 > 고급 옵션을 클릭합니다.
- 청구 가능한 최대 바이트 필드에 정수를 입력합니다.
- 저장을 클릭합니다.
bq
bq query
명령어를 --maximum_bytes_billed
플래그와 함께 사용합니다.
bq query --maximum_bytes_billed=1000000 \ --use_legacy_sql=false \ 'SELECT word FROM `bigquery-public-data`.samples.shakespeare'
API
JobConfigurationQuery
또는 QueryRequest
에서 maximumBytesBilled
속성을 설정합니다.
클러스터링되지 않은 테이블에서 LIMIT
를 사용하지 않음
권장사항: 클러스터링되지 않은 테이블의 경우 비용 관리 방법으로 LIMIT
절을 사용하지 마세요.
클러스터링되지 않은 테이블의 경우 LIMIT
절을 쿼리에 적용해도 읽은 데이터 양은 영향을 받지 않습니다. 쿼리가 하위 집합만 반환하더라도 쿼리에 표시된 대로 전체 테이블에서 읽은 모든 바이트 요금이 청구됩니다. 클러스터링된 테이블을 사용하면 LIMIT
절이 스캔되는 바이트 수를 줄일 수 있습니다. 결과를 가져오기 위해 충분한 블록이 스캔되면 스캔이 중지되기 때문입니다. 스캔된 바이트에 대해서만 요금이 청구됩니다.
쿼리 결과를 단계별로 구체화하기
권장사항: 가능한 경우 쿼리 결과를 단계별로 구체화합니다.
대량의 다단계 쿼리를 만들면 실행할 때마다 BigQuery가 쿼리에 필요한 모든 데이터를 읽습니다. 쿼리가 실행될 때마다 읽는 모든 데이터에 대한 요금이 청구됩니다.
하지만 쿼리를 단계별로 분할하면 각 단계에서 쿼리 결과를 대상 테이블에 기록하여 구체화할 수 있습니다. 작은 대상 테이블을 쿼리하므로 읽는 데이터의 양이 줄어들고 비용이 절감됩니다. 구체화된 결과를 저장하는 비용이 많은 양의 데이터를 처리하는 비용보다 훨씬 낮습니다.
워크로드 비용 관리
이 섹션에서는 워크로드 내에서 비용을 관리하기 위한 권장사항을 설명합니다. 워크로드는 관련 쿼리 집합입니다. 예를 들어 워크로드는 매일 실행되는 데이터 변환 파이프라인, 비즈니스 분석가 그룹에서 실행하는 대시보드 세트 또는 데이터 과학자 그룹에서 실행하는 여러 임시 쿼리일 수 있습니다.
Google Cloud 가격 계산기 사용
권장사항: Google Cloud 가격 계산기를 사용하여 예상 사용량을 기준으로 BigQuery의 전체적인 월별 비용을 예상할 수 있습니다. 그런 다음 이 추정치를 실제 비용과 비교하여 최적화할 영역을 파악할 수 있습니다.
주문형
주문형 가격 책정 모델을 사용할 때 Google Cloud 가격 계산기로 비용을 추정하려면 다음 단계를 따르세요.
- Google Cloud 가격 계산기를 엽니다.
- 합산하여 추정을 클릭합니다.
- BigQuery를 선택합니다.
- 서비스 유형에서 '주문형'을 선택합니다.
- 쿼리를 실행할 위치를 선택합니다.
- 쿼리된 데이터 양에 테스트 실행 또는 쿼리 검사기로 얻은 읽은 바이트 수 추정값을 입력합니다.
- 활성 스토리지, 장기 스토리지, 스트리밍 삽입, 스트리밍 읽기에 대한 스토리지 사용량의 추정값을 입력합니다. 데이터 세트 스토리지 청구 모델에 따라 물리적 스토리지 또는 논리적 스토리지만 추정하면 됩니다.
- 예상 비용은 비용 세부정보 패널에 표시됩니다. 예상 비용에 대한 자세한 내용을 보려면 세부정보 보기 열기를 클릭합니다. 비용 추정치를 다운로드하고 공유할 수도 있습니다.
자세한 내용은 주문형 가격 책정을 참조하세요.
버전
BigQuery 버전과 함께 용량 기반 가격 책정 모델을 사용할 때 Google Cloud 가격 계산기로 비용을 추정하려면 다음 단계를 따르세요.
- Google Cloud 가격 계산기를 엽니다.
- 합산하여 추정을 클릭합니다.
- BigQuery를 선택합니다.
- 서비스 유형에서 '버전'을 선택합니다.
- 슬롯이 사용되는 위치를 선택합니다.
- 버전을 선택합니다.
- 최대 슬롯, 기준 슬롯, 선택적 약정, 예상 자동 확장 사용률을 선택합니다.
- 데이터가 저장되는 위치를 선택합니다.
- 활성 스토리지, 장기 스토리지, 스트리밍 삽입, 스트리밍 읽기에 대한 스토리지 사용량의 추정값을 입력합니다. 데이터 세트 스토리지 청구 모델에 따라 물리적 스토리지 또는 논리적 스토리지만 추정하면 됩니다.
- 예상 비용은 비용 세부정보 패널에 표시됩니다. 예상 비용에 대한 자세한 내용을 보려면 세부정보 보기 열기를 클릭합니다. 비용 추정치를 다운로드하고 공유할 수도 있습니다.
자세한 내용은 용량 기반 가격 책정을 참고하세요.
예약 및 약정 사용
권장사항: BigQuery 예약 및 약정을 사용하여 비용을 관리하세요.
주문형 결제 모델을 사용하는 경우 비용을 제한하는 유일한 방법은 프로젝트 수준 또는 사용자 수준 일일 할당량을 구성하는 것입니다. 그러나 이러한 할당량은 사용자가 할당량 한도를 초과하여 쿼리를 실행하지 못하도록 하는 하드 캡을 적용합니다.
슬롯 예약을 사용하면 특정 워크로드에 사용할 수 있는 최대 슬롯 수를 지정할 수 있습니다. 약정 기간 동안 할인된 가격을 제공하는 슬롯 약정을 구매할 수도 있습니다. 자세한 내용은 BigQuery 예약 소개를 참고하세요.
슬롯 예측 도구 사용
권장사항: 슬롯 추정기를 사용하여 워크로드에 필요한 슬롯 수를 추정합니다.
BigQuery 슬롯 예측 도구를 사용하면 이전 성능 측정항목을 기준으로 슬롯 용량을 관리할 수 있습니다.
또한 주문형 가격 책정 모델을 사용하는 고객은 용량 기반 가격 책정으로 전환할 때 성능이 비슷한 약정 및 자동 확장 예약에 대한 크기 조정 추천을 확인할 수 있습니다.
대시보드를 사용하여 비용 보기
권장사항: BigQuery 사용량을 모니터링하고 조정할 수 있도록 Cloud Billing 데이터를 분석하는 대시보드를 만듭니다.
BigQuery로 결제 데이터를 내보내고 Looker Studio와 같은 도구로 시각화할 수 있습니다. 결제 대시보드 만들기에 대한 튜토리얼은 BigQuery와 Looker Studio를 사용하여 Google Cloud 결제 시각화를 참고하세요.
결제 예산 및 알림 사용하기
권장사항: Cloud Billing 예산을 사용하여 한곳에서 BigQuery 청구 내역을 모니터링합니다.
Cloud Billing 예산을 사용하면 계획한 비용 대비 실제 비용을 추적할 수 있습니다. 예산 금액을 설정한 후에는 이메일 알림을 트리거하는 데 사용되는 예산 알림 기준 규칙을 설정합니다. 예산 알림 이메일을 통해 BigQuery 비용의 예산 대비 추이를 파악할 수 있습니다.
맞춤 쿼리 할당량 만들기
권장사항: 맞춤 일일 쿼리 할당량을 사용하여 하루에 처리되는 데이터의 양을 제한합니다.
프로젝트 또는 사용자별로 하루에 처리되는 데이터 양의 한도를 지정하는 커스텀 할당량을 설정하여 비용을 관리할 수 있습니다. 할당량에 도달하면 사용자는 쿼리를 실행할 수 없습니다.
스토리지 비용 관리
BigQuery 스토리지 비용을 최적화하려면 다음 권장사항을 따르세요. 쿼리 성능을 위해 저장용량을 최적화할 수도 있습니다.
장기 스토리지 사용
권장사항: 장기 스토리지 가격을 사용하여 이전 데이터에 대한 비용을 줄이세요.
데이터를 BigQuery 스토리지로 로드하면 데이터에 BigQuery 스토리지 가격 책정이 적용됩니다. 이전 데이터의 경우 BigQuery의 장기 스토리지 가격 책정을 자동으로 활용할 수 있습니다.
연속으로 90일 동안 테이블을 수정하지 않으면 테이블의 스토리지 가격이 자동으로 50% 인하됩니다. 파티션을 나눈 테이블이 있는 경우 각 파티션은 파티션을 나누지 않은 테이블에 적용되는 규칙과 동일한 규칙에 따라 장기 가격 적용 대상으로 별도 간주됩니다.
스토리지 청구 모델 구성
권장사항: 사용량 패턴에 따라 스토리지 청구 모델을 최적화하세요.
BigQuery는 논리적(비압축) 바이트나 물리적(압축) 바이트 또는 이 둘의 조합을 사용하여 스토리지 청구를 지원합니다. 각 데이터 세트에 구성된 스토리지 청구 모델에 따라 스토리지 가격이 결정되지만 쿼리 성능은 영향을 받지 않습니다.
INFORMATION_SCHEMA
뷰를 사용하여 사용 패턴에 따라 가장 적합한 스토리지 청구 모델을 결정할 수 있습니다.
테이블 덮어쓰기 방지
권장사항: 물리적 스토리지 청구 모델을 사용하는 경우 테이블을 반복적으로 덮어쓰지 마세요.
일괄 로드 작업에서 --replace
매개변수를 사용하거나 TRUNCATE TABLE
SQL 문을 사용하여 테이블을 덮어쓰는 경우 대체된 데이터는 시간 여행 및 페일세이프 기간 동안 유지됩니다.
테이블을 자주 덮어쓰면 추가 스토리지 요금이 청구됩니다.
대신 로드 작업의 WRITE_APPEND
매개변수, MERGE
SQL 문을 사용하거나 storage write API를 사용하여 데이터를 테이블에 점진적으로 로드할 수 있습니다.
시간 이동 기간 줄이기
권장사항: 요구사항에 따라 시간 이동 기간을 줄일 수 있습니다.
시간 이동 기간을 기본값인 7일에서 줄이면 테이블에서 삭제되거나 변경된 데이터의 보관 기간이 줄어듭니다. 물리적(압축) 스토리지 청구 모델을 사용하는 경우에만 시간 이동 스토리지에 대한 요금이 청구됩니다.
시간 이동 기간은 데이터 세트 수준에서 설정됩니다. 기본 구성을 사용하여 새 데이터 세트의 기본 시간 이동 기간을 설정할 수도 있습니다.
대상 테이블에 테이블 만료 시간 사용
권장사항: 대량의 쿼리 결과를 대상 테이블에 쓰는 경우, 기본 테이블 만료 시간을 사용하여 더 이상 필요 없는 데이터를 삭제합니다.
BigQuery 스토리지에 대량의 결과 집합을 보관하면 비용이 발생합니다. 결과에 영구적으로 액세스할 필요가 없으면 기본 테이블 만료 시간을 사용하여 자동으로 데이터를 삭제합니다.
Cloud Storage로 데이터 보관처리
권장사항: Cloud Storage에 데이터를 보관처리하는 것이 좋습니다.
보관처리에 대한 비즈니스 요구사항에 따라 BigQuery에서 Cloud Storage로 데이터를 이동할 수 있습니다. 가장 좋은 방법은 BigQuery에서 데이터를 내보내기 전에 장기 스토리지 가격 책정 및 실제 스토리지 청구 모델을 고려하는 것입니다.
다음 단계
- BigQuery 가격 책정 알아보기
- 쿼리 최적화 방법 알아보기
- 스토리지 최적화 방법 알아보기
결제, 알림, 데이터 시각화에 대한 자세한 내용은 다음 주제 참조