데이터세트는 특정 프로젝트에 포함됩니다. 데이터 세트는 테이블과 뷰에 대한 액세스를 구성 및 제어하는 데 사용되는 최상위 컨테이너입니다. 테이블이나 뷰는 반드시 데이터 세트에 속해야 하므로, 개발자는 최소한 한 개 이상의 데이터 세트를 만든 후에 데이터를 BigQuery로 로드해야 합니다.
GoogleSQL을 사용할 경우 데이터 세트 이름을 정규화하려면 projectname.datasetname 형식을 사용하거나 bq 명령줄 도구를 사용할 때 projectname:datasetname 형식을 사용하여 데이터 세트 이름을 정규화합니다.
BigQuery 데이터 스토리지 요금은 논리적 또는 물리적(압축) 바이트 또는 이 둘의 조합으로 청구될 수 있습니다.
선택한 스토리지 청구 모델에 따라 스토리지 가격이 결정됩니다. 선택한 스토리지 청구 모델은 BigQuery 성능에 영향을 미치지 않습니다. 어떤 청구 모델을 선택하든 데이터는 물리적 바이트로 저장됩니다.
데이터 세트 수준에서 스토리지 청구 모델을 설정합니다.
데이터 세트를 만들 때 스토리지 청구 모델을 지정하지 않으면 기본적으로 논리적 스토리지 청구가 사용됩니다. 하지만 데이터 세트를 만든 후에 데이터 세트의 스토리지 청구 모델을 변경할 수 있습니다. 데이터 세트의 스토리지 청구 모델을 변경한 경우 스토리지 청구 모델을 다시 변경할 수 있으려면 14일을 기다려야 합니다.
데이터 세트의 청구 모델을 변경하면 변경사항이 적용되는 데 24시간 정도 걸립니다. 데이터 세트의 청구 모델을 변경하는 경우 장기 스토리지의 테이블 또는 테이블 파티션은 활성 스토리지로 재설정되지 않습니다.
쿼리 성능 및 쿼리 지연 시간은 데이터 세트의 청구 모델을 변경해도 영향을 받지 않습니다.
데이터 세트는 데이터 보관에 시간 이동 및 장애 안전 스토리지를 사용합니다.
시간 이동 및 장애 안전 스토리지는 물리적 스토리지 청구를 사용할 때 활성 스토리지 요금이 별도로 청구되지만 논리적 스토리지 청구를 사용할 경우 청구되는 기본 요율에 포함됩니다. 물리적 스토리지 비용과 데이터 보관의 균형을 맞추기 위해 데이터 세트에 사용되는 시간 이동 기간을 수정할 수 있습니다. 장애 안전 기간은 수정할 수 없습니다. 데이터 세트 데이터 보관에 대한 자세한 내용은 시간 이동 및 장애 안전을 통해 데이터 보관을 참조하세요.
스토리지 비용 예측에 대한 자세한 내용은 스토리지 청구 예측을 참조하세요.
조직에 데이터 세트와 동일한 리전에 있는 기존 레거시 정액제 슬롯 약정이 있으면 물리적 스토리지 청구에 데이터 세트를 등록할 수 없습니다. 이는 BigQuery 버전으로 구입한 약정에 적용되지 않습니다.
외부 데이터 세트
BigQuery 데이터 세트 외에도 외부 데이터 소스에 대한 링크인 외부 데이터 세트를 만들 수 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[[["\u003cp\u003eDatasets are top-level containers within a project that organize and control access to tables and views, requiring at least one dataset to be created before loading data into BigQuery.\u003c/p\u003e\n"],["\u003cp\u003eDataset locations are set during creation and cannot be changed afterward, impacting where data is stored and processed, with an option to copy or recreate the dataset if needed in a different location.\u003c/p\u003e\n"],["\u003cp\u003eStorage billing models for datasets can be chosen as either logical or physical, influencing storage pricing, although changing this model has a 14-day waiting period before another change can be made.\u003c/p\u003e\n"],["\u003cp\u003eExternal datasets, also known as federated datasets, link to external data sources like Spanner or AWS Glue, enabling queries without copying data into BigQuery.\u003c/p\u003e\n"],["\u003cp\u003eDatasets have limitations, such as location immutability post-creation, the need for tables in a query to be in the same location, and constraints on storage billing model changes.\u003c/p\u003e\n"]]],[],null,["# Introduction to datasets\n========================\n\nThis page provides an overview of datasets in BigQuery.\n\nDatasets\n--------\n\nA dataset is contained within a specific [project](/docs/overview#projects). Datasets\nare top-level containers that are used to organize and control access to your\n[tables](/bigquery/docs/tables) and [views](/bigquery/docs/views). A table\nor view must belong to a dataset, so you need to create at least one dataset before\n[loading data into BigQuery](/bigquery/loading-data-into-bigquery).\nUse the format `projectname.datasetname` to fully qualify a dataset name when\nusing GoogleSQL, or the format `projectname:datasetname` to fully qualify\na dataset name when using the bq command-line tool.\n\nLocation\n--------\n\nYou specify a location for storing your BigQuery data when you\ncreate a dataset. For a list of BigQuery dataset locations, see\n[BigQuery locations](/bigquery/docs/locations). After you create\nthe dataset, the location cannot be changed\n, but you can [copy datasets to different locations](/bigquery/docs/copying-datasets),\nor manually [move (recreate) the dataset in a different\nlocation](/bigquery/docs/managing-datasets#recreate-dataset).\n\nBigQuery processes queries in the same location as the dataset that\ncontains the tables you're querying. BigQuery stores your data in the\nselected location\nin accordance with the [Service Specific Terms](/terms/service-terms).\n\nData retention\n--------------\n\nDatasets use [time travel](/bigquery/docs/time-travel#time_travel) in\nconjunction with the [fail-safe period](/bigquery/docs/time-travel#fail-safe)\nto retain deleted and modified data for a short time, in case you need to\nrecover it. For more information, see\n[Data retention with time travel and fail-safe](/bigquery/docs/time-travel).\n\nStorage billing models\n----------------------\n\nYou can be billed for BigQuery data storage in either logical or\nphysical (compressed) bytes, or a combination of both.\nThe storage billing model you choose determines your\n[storage pricing](/bigquery/pricing#storage). The storage billing model you\nchoose doesn't impact BigQuery performance. Whichever billing\nmodel you choose, your data is stored as physical bytes.\n\nYou set the storage billing model at the dataset level.\nIf you don't specify a storage billing model when you create a dataset, it\ndefaults to using logical storage billing. However, you can\n[change a dataset's storage billing model](/bigquery/docs/updating-datasets#update_storage_billing_models)\nafter you create it. If you change a dataset's storage\nbilling model, you must wait 14 days before you can change the storage billing\nmodel again.\n\nWhen you change a dataset's billing model, it takes 24 hours for the\nchange to take effect. Any tables or table partitions in long-term storage\nare not reset to active storage when you change a dataset's billing model.\nQuery performance and query latency are not affected by changing a dataset's\nbilling model.\n\nDatasets use [time travel](/bigquery/docs/time-travel#time_travel) and\n[fail-safe](/bigquery/docs/time-travel#fail-safe) storage for data retention.\nTime travel and fail-safe storage are charged separately at active storage rates\nwhen you use physical storage billing, but are included in the base rate you are\ncharged when you use logical storage billing. You can modify the time travel\nwindow you use for a dataset in order to balance physical storage costs with\ndata retention. You can't modify the fail-safe window. For more information\nabout dataset data retention, see\n[Data retention with time travel and fail-safe](/bigquery/docs/time-travel).\nFor more information on forecasting your storage costs, see\n[Forecast storage billing](/bigquery/docs/information-schema-table-storage#forecast_storage_billing).\n\nYou can't enroll a dataset in physical storage billing if your organization has\nany existing legacy\n[flat-rate slot commitments](/bigquery/docs/reservations-commitments-legacy)\nlocated in the same region as the dataset. This doesn't apply to commitments\npurchased with a [BigQuery edition](/bigquery/docs/editions-intro).\n\nExternal datasets\n-----------------\n\nIn addition to BigQuery datasets, you can create external datasets, which are links to external data sources:\n\n- [Spanner external dataset](/bigquery/docs/spanner-external-datasets)\n- [AWS Glue federated dataset](/bigquery/docs/glue-federated-datasets)\n\n*External datasets* are also known as *federated datasets*; both terms are used interchangeably.\n\nOnce created, external datasets contain tables from a referenced external data source. Data from these tables aren't copied into BigQuery, but queried every time they are used. For more information, see [Spanner federated queries](/bigquery/docs/spanner-federated-queries).\n\nLimitations\n-----------\n\nBigQuery datasets are subject to the following limitations:\n\n- The [dataset location](/bigquery/docs/locations) can only be set at creation time. After a dataset is created, its location cannot be changed.\n- All tables that are referenced in a query must be stored in datasets in the same location.\n- External datasets don't support table expiration, replicas, time travel, default collation, default rounding mode, or the option to enable or disable case-insensitive table names.\n\n- When [you copy a table](/bigquery/docs/managing-tables#copy-table), the\n datasets that contain the source table and destination table must reside in\n the same location.\n\n- Dataset names must be unique for each project.\n\n- If you change a dataset's\n [storage billing model](#dataset_storage_billing_models), you must wait 14\n days before you can change the storage billing model again.\n\n- You can't enroll a dataset in physical storage billing if you have any\n existing legacy\n [flat-rate slot commitments](/bigquery/docs/reservations-commitments-legacy)\n located in the same region as the dataset.\n\nQuotas\n------\n\nFor more information on dataset quotas and limits, see\n[Quotas and limits](/bigquery/quotas#dataset_limits).\n\nPricing\n-------\n\nYou are not charged for creating, updating, or deleting a dataset.\n\nFor more information on BigQuery pricing, see [Pricing](/bigquery/pricing).\n\nSecurity\n--------\n\nTo control access to datasets in BigQuery, see\n[Controlling access to datasets](/bigquery/docs/control-access-to-resources-iam).\nFor information about data encryption, see [Encryption at rest](/bigquery/docs/encryption-at-rest).\n\nWhat's next\n-----------\n\n- For more information on creating datasets, see [Creating datasets](/bigquery/docs/datasets).\n- For more information on assigning access controls to datasets, see [Controlling access to datasets](/bigquery/docs/dataset-access-controls)."]]