데이터 세트 소개
이 페이지에서는 BigQuery의 데이터 세트에 대해 간략히 설명합니다.
데이터 세트
데이터 세트는 특정 프로젝트에 포함됩니다. 데이터 세트는 테이블과 뷰에 대한 액세스를 구성 및 제어하는 데 사용되는 최상위 컨테이너입니다. 테이블이나 뷰는 반드시 데이터 세트에 속해야 하므로, 개발자는 최소한 한 개 이상의 데이터 세트를 만든 후에 데이터를 BigQuery로 로드해야 합니다.
GoogleSQL을 사용할 경우 데이터 세트 이름을 정규화하려면 projectname.datasetname
형식을 사용하거나 bq 명령줄 도구를 사용할 때 projectname:datasetname
형식을 사용하여 데이터 세트 이름을 정규화합니다.
위치
데이터 세트를 만들 때는 BigQuery 데이터를 저장할 위치를 지정해야 합니다. BigQuery 데이터 세트 위치 목록은 BigQuery 위치를 참조하세요. 데이터 세트를 만든 후에는 위치를 변경할 수 없지만 데이터 세트를 다른 위치에 복사하거나 수동으로 다른 위치에서 데이터 세트를 이동(다시 만들기)할 수 있습니다.
BigQuery는 쿼리 중인 테이블이 포함된 데이터 세트와 동일한 위치에 있는 쿼리를 처리합니다. BigQuery는 서비스별 약관에 따라 선택된 위치에 데이터를 저장합니다.
데이터 보관
데이터 세트는 안전 조치 기간과 함께 시간 이동을 사용하여 나중에 복구할 필요가 있을 경우에 대비하여 삭제 및 수정된 데이터를 짧은 기간 동안 보관합니다. 자세한 내용은 시간 이동 및 장애 안전을 통해 데이터 보관을 참고하세요.
스토리지 청구 모델
BigQuery 데이터 스토리지 요금은 논리적 또는 물리적(압축) 바이트 또는 이 둘의 조합으로 청구될 수 있습니다. 선택한 스토리지 청구 모델에 따라 스토리지 가격이 결정됩니다. 선택한 스토리지 청구 모델은 BigQuery 성능에 영향을 미치지 않습니다. 어떤 청구 모델을 선택하든 데이터는 물리적 바이트로 저장됩니다.
데이터 세트 수준에서 스토리지 청구 모델을 설정합니다. 데이터 세트를 만들 때 스토리지 청구 모델을 지정하지 않으면 기본적으로 논리적 스토리지 청구가 사용됩니다. 하지만 데이터 세트를 만든 후에 데이터 세트의 스토리지 청구 모델을 변경할 수 있습니다. 데이터 세트의 스토리지 청구 모델을 변경한 경우 스토리지 청구 모델을 다시 변경할 수 있으려면 14일을 기다려야 합니다.
데이터 세트의 청구 모델을 변경하면 변경사항이 적용되는 데 24시간 정도 걸립니다. 데이터 세트의 청구 모델을 변경하는 경우 장기 스토리지의 테이블 또는 테이블 파티션은 활성 스토리지로 재설정되지 않습니다. 쿼리 성능 및 쿼리 지연 시간은 데이터 세트의 청구 모델을 변경해도 영향을 받지 않습니다.
데이터 세트는 데이터 보관에 시간 이동 및 장애 안전 스토리지를 사용합니다. 시간 이동 및 장애 안전 스토리지는 물리적 스토리지 청구를 사용할 때 활성 스토리지 요금이 별도로 청구되지만 논리적 스토리지 청구를 사용할 경우 청구되는 기본 요율에 포함됩니다. 물리적 스토리지 비용과 데이터 보관의 균형을 맞추기 위해 데이터 세트에 사용되는 시간 이동 기간을 수정할 수 있습니다. 장애 안전 기간은 수정할 수 없습니다. 데이터 세트 데이터 보관에 대한 자세한 내용은 시간 이동 및 장애 안전을 통해 데이터 보관을 참조하세요. 스토리지 비용 예측에 대한 자세한 내용은 스토리지 청구 예측을 참조하세요.
조직에 데이터 세트와 동일한 리전에 있는 기존 레거시 정액제 슬롯 약정이 있으면 물리적 스토리지 청구에 데이터 세트를 등록할 수 없습니다. 이는 BigQuery 버전으로 구입한 약정에 적용되지 않습니다.
외부 데이터 세트
BigQuery 데이터 세트 외에도 외부 데이터 소스에 대한 링크인 외부 데이터 세트를 만들 수 있습니다.
외부 데이터 세트는 제휴 데이터 세트라고도 하며 두 용어는 서로 바꿔서 사용할 수 있습니다.
외부 데이터 세트가 생성되면 참조된 외부 데이터 소스의 테이블이 포함됩니다. 이러한 테이블의 데이터는 BigQuery로 복사되지 않으며, 사용될 때마다 쿼리됩니다. 자세한 내용은 Spanner 통합 쿼리를 참고하세요.
제한사항
BigQuery 데이터 세트에는 다음과 같은 제한사항이 적용됩니다.
- 데이터 세트 위치는 생성 당시에만 설정할 수 있습니다. 데이터 세트를 만든 후에는 위치를 변경할 수 없습니다.
- 쿼리에서 참조하는 모든 테이블은 같은 위치의 데이터 세트에 저장해야 합니다.
외부 데이터 세트는 테이블 만료, 복제본, 시간 여행, 기본 정렬, 기본 반올림 모드 또는 대소문자를 구분하지 않는 테이블 이름을 사용 설정하거나 사용 중지하는 옵션을 지원하지 않습니다.
테이블을 복사할 때 소스 테이블과 대상 테이블을 포함하는 데이터 세트는 같은 위치에 있어야 합니다.
프로젝트마다 데이터 세트 이름이 달라야 합니다.
데이터 세트의 스토리지 청구 모델을 변경한 경우 스토리지 청구 모델을 다시 변경할 수 있으려면 14일을 기다려야 합니다.
데이터 세트와 동일한 리전에 있는 기존 레거시 정액제 슬롯 약정이 있으면 물리적 스토리지 청구에 데이터 세트를 등록할 수 없습니다.
할당량
데이터 세트 할당량과 한도에 대한 자세한 내용은 할당량 및 한도를 참조하세요.
가격 책정
데이터 세트 만들기, 업데이트, 삭제에 대해서는 요금이 청구되지 않습니다.
BigQuery 가격에 대한 자세한 내용은 가격을 참조하세요.
보안
BigQuery에서 데이터 세트에 대한 액세스를 제어하려면 데이터 세트에 대한 액세스 제어를 참조하세요. 데이터 암호화에 대한 자세한 내용은 저장 데이터 암호화를 참조하세요.
다음 단계
- 데이터 세트 만들기에 대한 자세한 내용은 데이터 세트 만들기를 참조하세요.
- 데이터 세트에 대한 액세스 제어 할당에 대한 자세한 내용은 데이터 세트에 대한 액세스 제어를 참조하세요.